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Prefacio 


Este libro es un texto para el primer nivel universitario. No presupone “cierta 
madurez matemática” sino que se empeña en crearla, y sólo requiere del estu- 
diante conocimientos mínimos del lenguaje de teoría de conjuntos, además de 
su esfuerzo. Fue concebido y experimentado en cursos de geometría analítica 
de primer año de las licenciaturas en matemáticas, física, actuaría y ciencias 
de la computación; pero puede extenderse a otras áreas y emplearse en otros 
niveles. 

A principios del siglo XXI, la geometría —como área de las matemáticas— 
evade las definiciones pues sus límites son difusos y sus ramificaciones nu- 
merosas. Es, quizá, más que un cuerpo bien definido de conocimiento: una 
sensibilidad al practicar el pensamiento abstracto. El título de “geómetra” hoy 
se lo disputan matemáticos de muy diversas áreas; por dar ejemplos, los que 
hacen investigación en geometría algebraica, geometría diferencial o geometría 
discreta se llaman a sí mismos “geómetras”, con orgullo, a secas y con razón, 
pero a veces también con soberbio aire excluyente. Además, a cada rato apare- 
cen nuevas sectas de “geómetras” que abren y bautizan áreas como “geometría 
computacional”, “geometría simpléctica” o “geometría no conmutativa”, por 
no hablar del uso del término como calificativo: “topología geométrica”, “con- 
vexidad geométrica”, “teoría geométrica de grupos”, “física geométrica”, etc. 
Quiero dar a entender con esta breve enumeración —que sólo a unos pocos 
lectores dice algo más que la rimbombancia misma de las palabras— que la 
Geometría, ahora sí, con mayúsculas, está vivita y coleando: en plena ex- 
pansión como el resto de la ciencia. Sea lo que fuere, área o sensibilidad, es 
un motor pujante, activo y prolífico en el imponente desarrollo actual de las 
matemáticas. Es, en fin, una parte medular de la matemática contemporánea, 
pero a su vez la rebasa como sensibilidad o por sus aplicaciones, la desborda 
en sus manifestaciones naturales o artísticas; es una gema de nuestra cultura. 

Sin embargo, y en contraste preocupante con este panorama, la educación 
de la geometría en el nivel universitario básico ha quedado estancada y ha sido 
relegada casi hasta la vacuidad. En muchas universidades, el curso clásico de 
“geometría analítica” ha desaparecido o se ha integrado a los cursos de cálculo 
como servicio, pues las cónicas —argumentan— son de nivel bachillerato; y 
en aquellas donde aún se da es con programas obsoletos que parecen ignorar 
que el siglo XIX aconteció. Los cursos de “geometría sintética” o “a la gr- 
lega”, a veces llamados con ironía involuntaria “geometría moderna” —pues 
tratan de “geometría griega” hecha despues de ellos— , también se sienten 
anquilosados y, en el mejor de los casos, se usan como materias optativas de 
divertimento histórico, didáctico o formativo, desligados por completo del resto 
del currículo científico. No obstante, se siguen formando geómetras pues la 
sensibilidad geométrica es irrefrenable. Los estudiantes que la tienen —don, 
vocación, inquietud o visión del mundo— aprenden por ósmosis y desarrollan 
su intuición en otros cursos básicos o intermedios, como el de álgebra lineal o 
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topología, y sólo hasta niveles avanzados de licenciatura o maestría vuelven a 
encontrar “geometrías”, pero ya con apellidos de abolengo como “algebraica”, 
“riemanniana” o “diferencial”, o en boga como “cuántica” y “computacional”, 
ya muy especializadas. 

Este contraste entre la vitalidad de la geometría en el desarrollo de las 
matemáticas —su enorme importancia en ellas— por un lado, y por el otro, 
su magro valor curricular en la formación básica de científicos y profesionistas 
—su ausencia en la cultura ciudadana mínima—, obliga a una reflexión seria, 
sobre todo de parte de los que nos consideramos geómetras. 

Para arañar la superficie de esta discusión, tengo que recurrir al balance 
entre las dos grandes tendencias, fuerzas O procesos que desarrollan la ciencia 
(cuya frontera es difícil dibujar.) Se tiene por un lado la fuerza creativa o 
de investigación que la hace avanzar y conquistar nuevo conocimiento. Pero 
además, hay un proceso de digestión, destilación o decantación en el cual nos 
vamos quedando con lo fundamental de las grandes teorías al reprocesar las 
ideas básicas, limpiar los argumentos centrales o aclarar y simplificar los ra- 
zonamientos y construcciones; de tal manera que cada generación tiene acceso 
a ese conocimiento a una edad más temprana y con más profundidad que sus 
predecesoras. 

En el siglo XX el proceso de digestión de las matemáticas se centró en sus 
fundamentos y formalización. Se creó un lenguaje, un estilo y una notación 
basados en la Teoría de Conjuntos (iniciada por Georg Cantor hacia finales del 
XIX) que permeó y cambió a todas las matemáticas; desde cómo se presentan 
a los párvulos hasta cómo se escriben sus artículos de investigación, pasando, 
por supuesto, por sus libros de texto y los currículos de todos los niveles de 
enseñanza. Pecando de simplismo pero, y valga la redundancia, en aras de 
simplificar mi argumento, permítaseme ubicar este monumental cambio en el 
ámbito de lo simbólico: “la otra sensibilidad” para enfrentar las matemáticas. 
Me aventuro a afirmar entonces que la digestión de la geometría quedó rezagada 
porque la energía intelectual de un siglo no puede desperdigarse demasiado. 
Pero la marea, como el siglo, está cambiando. 

En los últimos 20 o 30 años del siglo XX, se dio un renacimento de la 
geometría del siglo XIX en el nivel de investigación que se está digiriendo rápi- 
damente y permeando en la enseñanza. La geometría hiperbólica renació ligada 
a la topología en dimensiones bajas; la geometría proyectiva revivió como fun- 
damento para desarrollar la visualización por computadora —y ésta a su vez 
revaloró la parte algorítmica de la geometría (las construcciones con regla y 
compás que apasionaban a los griegos) —; los grupos geométricos encontraron 
excitantes aplicaciones en la física, etc. Y en este entorno, han aparecido nuevos 
libros de texto que dan a la geometría un enfoque más “kleiniano”. Lo llamo 
así porque al concluir el siglo XIX —en el que se convulsionó la geometría 
al descubrirse sus versiones no euclidianas— la “Geometría” había dejado de 
ser una unidad, se había “desvalagado” en múltiples direcciones al parecer di- 
vergentes y Felix Klein, en su famosa ponencia del Programa de Erlangen y 
con profundidad visionaria, trató de resumir esta revolución diciendo, a muy 


grandes rasgos, que “la geometría es el estudio de espacios junto con sus grupos 
de transformaciones”. Casi un siglo después, empezó a plasmarse esta filosofía 
en textos de nivel medio universitario. 

De estos nuevos libros de texto, tuvieron gran influencia sobre mí, y por 
lo tanto en el presente libro, el de E. Rees [12] y el de P. J. Ryan [14]. Sin 
embargo, presuponen ya una cierta madurez matemática de parte del estudi- 
ante; la filosofía de este libro (enfatizar los grupos de transformaciones) es muy 
parecida pero llevada a un nivel más elemental, introductorio. Se desarrolló en 
los cursos de Geometría Analítica que periódicamente he dado en la Facultad 
de Ciencias de la UNAM durante 18 años. Con un programa oficial que bien 
podría datar del siglo XVIII (la geometría analítica como se entendía entonces), 
este curso ha ido evolucionando hasta su presente forma. La condición inicial de 
tener que cubrir un programa basado en el estudio de las cónicas, más que es- 
torbar, acabó dándole una gran consistencia. Pues los problemas que plantean 
motivan el desarrollo teórico que a su vez, con más herramientas geométricas en 
mano, permiten entenderlas más profundamente y plantear nuevos problemas 
que a su vez... así que quedaron tratadas en cuatro capítulos (2, 4, 7 y 9). 

Es frecuente pensar (yo lo hice por demasiado tiempo) que la geometría 
analítica representa un rompimiento con la geometría griega clásica, presen- 
tarla como algo que la supera; o bien, creer que las geometrías proyectiva e 
hiperbólica rompen con la euclidiana y que hay que tomar partido por alguna. 
No. Son todas ellas parte de lo mismo: La Geometría. Y para hacer énfasis en 
ello, una preocupación que entreteje al capítulo 1 es reconstruir la axiomática 
euclidiana a partir de la de los números reales que es la de la geometría analítica, 
y aclarar formalmente su relación. Parece superfluo, pero permite ejercitar las 
operaciones vectoriales y la idea de “demostración” en casos sencillos e intu- 
itivamente claros, va construyendo la llamada “madurez matemática” y en los 
ejercicios, tanto teóricos como númericos, debe dar al estudiante seguridad y 
fe en su intuición geométrica; el riesgo de parecer trivial quizá se conjure con 
la idea profunda de que el lenguaje y las técnicas vectoriales que se van es- 
tableciendo en el plano funcionarán también para las siguientes dimensiones. 
Más adelante (capítulos 6 y 8, respectivamente), como se construyen los planos 
proyectivo e hiperbólico, ya no hay necesidad de axiomatizar; vamos sobre 
terreno firme y los axiomas quedan como observaciones o teoremas con notas 
históricas. 

Si insisto en que La Geometría es una y única, ¿por qué pluralizarla en 
el título del libro? Por dos razones. Así como en español tenemos la afortu- 
nada dualidad “la matemática” y “las matemáticas” con significados sutilmente 
diferentes, siento que lo mismo se aplica a “la geometría”. “Las geometrías” 
tendría entonces una acepción más modesta, con una implícita diversidad de 
enfoques y motivaciones posibles; pretendo, quizá pecando de ambicioso e iluso, 
que aquí se den los fundamentos modernos para adentrarse en ellas y en espe- 
cial en las que están vivas en este cambio de siglo. Pero además, el plural tiene 
la ventaja de que remite inevitablemente a las geometrías no euclidianas, cuyos 
rudimentos básicos, creo yo, deberían ser parte de la formación temprana en 
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matemáticas, e integrarse a la cultura mínima común sobre ellas. Sin embargo, 
por “las geometrías” no quiero entender sólo a las tres clásicas sino algo más 
cercano a la enumeración del principio. Al final de varios capítulos se incluyen 
secciones marcadas con un asterisco que indica que no es esencial para el desar- 
rollo ulterior del libro; son pequeñas introducciones o disertaciones hacia áreas 
o temas aledaños, hacia “otras geometrías”. Están ahí para incitar la curiosidad 
de los estudiantes o para dar más material a los maestros que las sientan afines. 
Por ejemplo, al final del capítulo 1, después de haber insistido en la maravillosa 
idea de Descartes de asociarle numeritos a los puntos que forman un plano y de 
haber hecho escencialmente lo mismo con las rectas mediante los coeficientes 
de sus ecuaciones, está a la mano preguntarse ¿geométricamente, qué forman 
las rectas del plano? Surge la banda de Moebius, una bonita motivación para 
entrar a la topología: gloria indiscutible de La Geometría del siglo XX. 


En geometría, y sobre todo en el nivel elemental pero con una persistencia 
sorprendente hasta niveles más abstractos, los dibujos son parte fundamental 
del discurso matemático, del razonamiento, del proceso de entender y descubrir; 
quizá lo que tenga más que ver con eso de la “sensibilidad geométrica” que 
tanto he cacareado; son básicos para “visualizar” —yo no puedo prescindir de 
ellos en el salón de clase—. Pero sabemos bien que no son más que muletas 
para acceder a las verdaderas matemáticas. Una figura al margen o en el 
pizarrón es —en el mejor de los casos y de no ser un bosquejo esquemático 
de algo mucho más complicado— una instancia muy particular y aproximada 
de un razonamiento, de una definición o, digamos, de un cierto teorema. Las 
computadoras permiten liberar un poco esta particularización o congelamiento 
de los dibujos. Podemos tener figuras animadas que den la idea de un proceso 
continuo o que, al menos, hagan variar las instancias particulares donde se 
cumple el teorema. Pero también podemos tener figuras interactivas donde el 
“usuario” mueve los parámetros u objetos variables a los que alude la figura 
al mismo tiempo que ve en pantalla los efectos de sus actos, y entonces (en 
principio) puede pasar por todas las instancias a las que se refiere el teorema. 
Ambas muletas se acercan un poco más al teorema en sí; al menos amplían 
los ejemplos donde se cumple y ciertamente proveen una nueva intuición que 
debe ser bienvenida y explotada. Adjuntamos un disco compacto con una 
selección de figuras del libro a las que se dotó de algún don dinámico. Con 
una computadora se puede jugar con ellas —me sorprendió, en algunas, lo lejos 
que mi intuición andaba de la realidad— y quizá coadyuven a generar nuevas 
maneras de relacionarse con la geometría y las matemáticas. Fueron creadas 
con el programa Cinderella9 y son, en su gran mayoría, construcciones clásicas 
con regla y compás; sus códigos, programas o algoritmos también vienen en el 
CD y pueden entonces servir como ejemplos didácticos de este recién resucitado 
arte que, como parte fundamental de la geometría, nació con los griegos. 

Es un hecho que el enfoque (históricamente) original con el que se resuelven 
los problemas no es siempre el más directo, conciso, claro o elegante. Lo mismo 
sucede con las grandes teorías; su enseñanza siguiendo estrictamente su línea 
de desarrollo histórico no es necesariamente la más profunda o eficiente. Estoy 


convencido de que la cultura geométrica general, y muy en especial la de los 
científicos y matemáticos, debe actualizarse con urgencia para tener un rezago 
de por lo más un siglo, no de cuatro, y esto requiere buscar caminos e itinerarios 
alternativos que lleven de manera más simple y expedita a la geometría que se 
cocina hoy día. Este libro es fruto de mi esfuerzo para contribuir a ello. 


Prólogo para el maestro 


Aunque este libro esté pensado para un curso de un año, creo que en dos 
semestres es casi imposible cubrir todo su material. Yo nunca lo he logrado. 
Basicamente por las “secciones asterisco” de las que hablé antes, esos diver- 
timentos laterales y aledaños sobre los cuales trabajo con distinta (o nula) 
profundidad dependiendo de los tiempos del curso, el grupo o mis intereses del 
momento. Sin embargo, siento que es importante que estén ahí. Si el estudi- 
ante decide brincarse olímpicamente alguno de ellos porque no es material del 
examen que le apremia, aprenderá que los libros de matemáticas pueden leerse 
a saltos, a veces grandes para adelante y cuando es necesario para atrás. Y si 
los lee por su cuenta, que sí creo posible que se haga con todas, quizá estimule 
su curiosidad o creatividad; al menos ampliará su cultura. En fin, más vale que 
sobre y no que falte, que se abran panoramas y no dar la impresión de algo ya 
hecho, estático y sin puertas o futuros posibles. 

Sin embargo, sí creo que el material básico puede cubrirse en un año. Un 
semestre para el plano euclidiano, sus transformaciones y, con éstas últimas 
como herramienta, la clasificación de las cónicas; y el segundo para la esfera 
y el espacio, los planos proyectivo e hiperbólico y algo más de cónicas como 
apoyo, herramienta (en la construcción del plano hiperbólico) y motivación. 
Por supuesto, los énfasis o la profundidad con que se vean algunas partes no 
esenciales depende de los gustos y necesidades de cada maestro. 

Me imagino también que los capítulos 3 (a “salto de mata”), 6 (con refer- 
encias a parte del 5) y 8 (con las pocas definiciónes que usa del 7) pueden ser 
el material de un curso semestral intermedio de geometrías no euclidianas para 
estudiantes que sepan geometría analítica clásica, algo de álgebra lineal y algo 
de teoría de grupos; el resto del libro será repaso o “asterisco”. 

De álgebra líneal se da necesariamente una introducción (capítulos 1 y prin- 
cipio del 5), pero es lo mínimo para hacer geometría en dimensiones 2 y 3; 
servirá de motivación y experiencia para un curso general. Los grupos en 
abstracto apenas se mencionan tangencialmente, de hecho ni siquiera se de- 
finen formalmente, pues el interés está únicamente en los grupos geométricos 
de transformaciones. Darán al estudiante una multitud de ejemplos e intuición 
para enfrentarse, en su momento, al álgebra moderna, en especial las secciones 
asterisco sobre grupos geométricos finitos y discretos. Puede entonces servir 
como texto de apoyo para materias más algebráicas. 

La naturalidad en el orden en que se presentan las ideas matemáticas es, 
muchas veces, subjetiva. Cada maestro o cada autor siente esto a su manera; 
“las matemáticas no son simplemente conexas”. Por ejemplo, para alguien que 
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sabe, parece una locura hablar de transformaciones ortogonales antes de las 
lineales como aquí se hace; la razón es que las isometrías están más cerca de la 
intuición de alguien que no sabe de ninguna de ellas y al seguir el razonamiento 
desde esta óptica se obtiene, naturalmente creo yo, la noción de ortogonalidad 
y, con ésta, la linealidad como resultado: ello se convierte en motivación para 
definirlas. Por supuesto, el maestro que siga el orden clásico (más natural si 
de antemano se sabe de linealidad), o el de su gusto, y use a la vez este texto, 
enriquecerá la visión del estudiante. 

En algunos otros lados del libro pasa lo mismo, hay alteraciones al orden 
que, en décadas pasadas, se nos enseñó como natural. No hay espacio para 
dar mis razones particulares. Pero en general, puedo decir que se deben a 
tres razones básicas: dar al texto consistencia interna y hacerlo, en la medida 
de lo posible, autocontenido; tratar de seguir líneas de razonamiento con mo- 
tivaciones generales precisas y buscar dar ejemplos relevantes después de las 
definiciones para familiarizarse con ellas (por ejemplo, las coordenadas baricén- 
tricas se introducen tan temprano para presentar el Teorema del Baricentro y 
así jugar con combinaciones lineales.) 


Prólogo para el estudiante 


Aprender matemáticas es un acto de soledad. Escuchar a un maestro o leer 
un libro ayudan y quizá explicar a alguien, o discutir, sirva más; pero a fin 
de cuentas requiere un proceso íntimo de creación y recreación. Por eso, leer 
matemáticas tiene sus propios ritmos o mañas que cada quien desarrolla. Una 
buena es la del lápiz y papel a la mano, dándoles su tiempo; otra, la de leer 
tramos rápido y por ensima para luego regresar, si acaso, a los detalles. Algo 
importante en un libro de texto como éste es entablar, al menos, breves escara- 
muzas mentales con los ejercicios. Hay que notar que algunos de ellos tienen 
un asterisco, y eso es porque son más dificiles que los otros; vale la pena pre- 
guntarse por qué. Y en general, ésa es la actitud correcta ante un texto de 
matemáticas: siempre hay que cuestoinarlo tratando de mejorarlo o corregirlo; 
no necesariamente su ritmo o hilo de razonamiento es el natural de uno, y 
encontrar esa “voz” es aprender. Un texto matemático, por decirlo así, nos 
presta su voz por un rato, pero aprender, o entender, es poder referirnos a las 
matemáticas a las que alude con nuestra propia voz, ser capaces de verlas con 
nuestros propios ojos. 
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Capítulo 1 


El plano euclidiano 


1.1 La geometría griega 


En el principio, la geometría era una colección de reglas de uso común para medir y 
construir casas y ciudades. No fue hasta el año 300 a.C. que Euclides de Alejandría, en 
sus Elementos, ordenó y escribió todo ese saber, imprimiéndole el sello de rigor lógico 
que caracteriza y distingue a las matemáticas. Se dio cuenta de que todo razonamiento 
riguroso (o demostración) debe basarse en ciertos principios previamente establecidos 
ya sea, a su vez, por otra demostración o bien por convención. Pero a final de cuentas, 
este método conduce a la necesidad ineludible de convenir en que ciertos principios 
básicos (postulados o axiomas) son válidos sin necesidad de demostrarlos, que están 
dados y son incontrovertibles para poder construir sobre ellos el resto de la teoría. Lo 
que hoy se conoce como Geometría Euclidiana, y hasta hace dos siglos simplemente 
como Geometría, está basada en los cinco postulados de Euclides: 


I Por cualesquiera dos puntos, se puede trazar el segmento de recta que los une. 


II Dados un punto y una distancia, se puede trazar el círculo con centro en el punto 
y cuyo radio es la distancia. 


III Un segmento de recta se puede extender en ambas direcciones indefinidamente. 
IV'_Todos los ángulos rectos son iguales. 


V Dadas dos rectas y una tercera que las corta, si los ángulos internos de un lado 
suman menos de dos ángulos rectos, entonces las dos rectas se cortan y lo hacen 
de ese lado. 


Obsérvese que en estos postulados se describe el comportamiento y la relación entre 
ciertos elementos básicos de la geometría, como son “punto”, “trazar”, “segmento”, 
“distancia”, etc. De alguna manera, se le da la vuelta a su definición haciendo uso de 
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la noción intuitiva que se tiene de ellos y haciendo explícitas ciertas relaciones básicas 
que deben cumplir. 

De estos postulados o axiomas, el quinto es el más famoso pues se creía que po- 
dría deducirse de los otros. Es más sofisticado, y entonces se pensó que debía ser 
un teorema, es decir, ser demostrable. De hecho, un problema muy famoso fue ése: 
demostrar el quinto postulado usando únicamente los otros cuatro. Y muchísimas 
generaciones de matemáticos lo atacaron sin éxito. No es sino hasta el siglo XIX, y 
para sorpresa de todos, que se demuestra que no se puede demostrar; que efectiva- 
mente hay que suponerlo como axioma, pues negaciones de él dan origen a “nuevas 
geometrías”, tan lógicas y bien fundamentadas como la euclidiana. Pero esta histo- 
ria se verá más adelante (en los capítulos 6 y 8) pues por el momento nos interesa 
introducir la geometría analítica. 

La publicación de la “Géométrie” de Descartes marca una revolución en las 
matemáticas. La introducción del álgebra a la solución de problemas de índole ge- 
ométrico desarrolló una nueva intuición y, con ésta, un nuevo entender de la naturaleza 
de las “lignes courves”. 

Para comprender lo que hizo René Descartes (1596-1650), se debe tener más 
familiaridad con el quinto postulado. Además del enunciado original, hay otras dos 
versiones que son equivalentes: 


V.a (El Quinto) Dada una línea recta y un punto fuera de ella, existe una única 
recta que pasa por el punto y que es paralela a la línea. 


V.b Los ángulos interiores de un triángulo suman dos ángulos rectos. 


De las tres versiones que hemos dado del quinto postulado de Euclides, usaremos 
a lo largo de este libro a la V.a, a la cual nos referiremos simplemente como “El 
Quinto” . 

Antes de entrar de lleno a la Geometría Analítica demostremos, a manera de home- 
naje a los griegos y con sus métodos, uno de sus teoremas más famosos e importantes. 


Teorema 1.1 (de Pitágoras) Dado un triángulo rectángulo, si los lados 
que se encuentran en un ángulo recto (llamados catetos) miden a y b, y el 
tercero (la hipotenusa) mide c, entonces 


a? + b?=.e?. 


Demostración. Considérese un cuadrado de lado a + b, y colóquense en él cuatro 
copias del triángulo de dos maneras diferentes como en la figura. Las areas que quedan 
fuera son iguales. O 
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Aunque la demostración anterior (hay otras) parece 


no usar nada, queda implícito el uso del quinto postu- 
lado; pues, por ejemplo, en el primer cuadrado, que el 
cuadradito interno de lado c tenga ángulo recto usa su D' 
versión V.b. Además, hace uso de nuevos conceptos no 


como son el área y cómo calcularla; en fin, hace uso , 
de nuestra intuición geométrica, que debemos creer y 


fomentar. Pero vayamos a lo nuestro. 


“EJERCICIO 1.1 Demuestra la equivalencia de V, V.a y V.b. Aunque no muy formal- 
mente (como en nuestra demostración del Teorema de Pitágoras), convencerse con dibujos 
de que tienen todo que ver entre ellos. 


EJERCICIO 1.2 Demuestra el Teorema de Pitágoras ajustando (sin que se traslapen) 


cuatro copias del triángulo en un cuadrado de lado e y usando que (b— a)? = b? —2ab+ a? 
(estamos suponiendo que a < b, como en la figura anterior). 


1.2 Puntos y parejas de números 


Para reinterpretar el razonamiento que hizo Descartes, supongamos por un momento 
que conocemos bien el plano euclidiano definido por los cinco axiomas de los Ele- 
mentos; es el conjunto de puntos que se extiende indefinidamente a semejanza de 
un pizarrón, un papel, un piso o una pared y viene acompañado de nociones como 
rectas y distancia, entre otras; y en el cual se pueden demostrar teoremas como el de 
Pitágoras. Denotaremos por E? a este plano; en este caso el exponente 2 se refiere a 
la dimensión y no es exponenciación (no es “E al cuadrado”, sino que debe leerse “E 
dos”). Da la idea de que puede haber espacios euclidianos de cualquier dimensión JE 
(léase “E ene”), aunque sería complicado definirlos axiomáticamente. De hecho los 
definiremos, pero de una manera más simple, que es con el uso de coordenadas: la 
idea genial de Descartes. Podríamos ahora, apoyados en el lenguaje moderno de los 
conjuntos,! recrear su razonamiento como sigue. 


El primer paso es notar que los puntos de una recta £ C E? corresponden biunívo- 
camente a los números reales, que se denotan por R. Escogemos 
un punto O € l que se llamará el origen y que corresponderá al 
número cero. El origen parte a la recta en dos mitades; a una de O qa 
ellas se le asocian los números positivos de acuerdo con su distan- q 
cia al origen, y a la otra mitad, los números negativos. Así, a cada 
número real x se le asocia un punto p € l, y a cada punto en l le corresponde un 
número real. 


'La notación básica de conjuntos se establece e introduce brevemente en el Apéndice. 
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De esta identificación natural surge el nombre de “recta de los números reales” 
y todo el desarrollo ulterior de la Geometría Analítica, e inclusive del Cáculo. Los 
números tienen un significado geométrico (los griegos lo sabían bien al entenderlos 
como distancias), y entonces problemas geométricos (y físicos) pueden atacarse y 
entenderse manipulando números. 


El segundo paso para identificar los puntos del plano euclidiano con parejas de 
números hace uso esencial del quinto postulado. T'ómense dos rectas fl; y l en el plano 
JE? que se intersecten en un punto O que será el origen. Orientamos las rectas para 
que sus puntos correspondan a números reales, como arriba. Entonces a cualquier 
punto p € E? se le puede hacer corresponder una pareja de números de la siguiente 
forma. Por el Quinto, existe una única recta (, que pasa 
por p y es paralela a fl¡; y análogamente, existe una única 
recta ( que pasa por p y es paralela a l7. Las intersecciones 
(108 y 2 Nl, determinan los puntos pi E fl; y p2 € Ll», 
respectivamente, y por tanto, determinan dos números reales 
x y y; es decir, una pareja ordenada (x, y). Y al revés, dada 
la pareja de números (x,y), tómense p¡ como el punto que 
está sobre f¡ a distancia x de O, y p2 como el punto que está 
sobre l a distancia y de O (tomando en cuenta signos, por 
supuesto). Sea (; la recta que pasa por p» paralela a l; y sea 
() la recta que pasa por py paralela a l, (¡acabamos de usar de nuevo al Quinto!). La 
intersección f NL es el punto p que corresponde a la pareja (x, y). 


La generalidad con que hicimos el razonamiento ante- 
rior fue para hacer explícito el uso del quinto postulado 
en el razonamiento clásico de Descartes, pero no conviene 
dejarlo tan ambiguo. Es costumbre tomar a las rectas l; 
y l, ortogonales: a f horizontal con su dirección positiva 
a la derecha (como vamos leyendo), conocida tradicional- 
mente como el eje de las x ; y a l vertical con dirección 
positiva hacia arriba, el famoso eje de las y . No sólo es 
por costumbre que se utiliza esta convención, sino también 
porque simplifica el álgebra asociada a la geometría clásica. 
Por ejemplo, permitirá usar el teorema de Pitágoras para 
calcular facilmente las distancias a partir de las coordenadas. Pero esto se verá más 
adelante. 
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En resumen, al fijar los ejes coordenados, a cada pareja de números (x,y) le 
corresponde un punto p € E?, pero iremos más allá y los identificaremos diciendo 
p = (x,y). Además, se le puede hacer corresponder la flecha 
(segmento de recta dirigido llamado vector) que “nace” en el 
origen y termina en el punto. Así, las siguientes interpretaciones 
son equivalentes y se usarán de manera indistinta a lo largo de 
todo el libro. 
> a. Un punto en el plano. 


(1,4) 


b. Una pareja ordenada de números reales. 
c. Un vector que va del origen al punto. 

Nótese que si bien en este texto las palabras punto y vector son equivalentes, 
tienen diferentes connotaciones. Mientras que un punto es pensado como un lugar 
(una posición) en el espacio, un vector es pensado como un segmento de línea dirigido 
de un punto a otro. 

El conjunto de todas las parejas ordenadas de números se denota por R? =R xR. 
En este caso el exponente 2 sí se refiere a exponenciación, pero de conjuntos, lo que se 
conoce ahora como el producto cartesiano en honor de Descartes (véase el Apéndice 
A); aunque la usanza común es leerlo “R dos”. 


1.2.1 Geometría analítica 


La idea genialmente simple IR? = E? (es decir, las parejas ordenadas de números reales 
se identifican naturalmente con los puntos del plano euclidiano) logra que converjan 
las aguas del álgebra y la geometría. A partir de Descartes se abre la posibilidad de 
reconstruir la geometría de los griegos sobre la base de nuestra intuición númerica 
(básicamente la de sumar y multiplicar). Y a su vez, la luz de la geometría baña con 
significados y problemas al álgebra. Se hermanan, se apoyan, se entrelazan: nace la 
geometría analítica. 

De aquí en adelante, salvo en contadas ocasiones donde sea inevitable y como 
comentarios, abandonaremos la línea del desarrollo histórico. De hecho, nuestro 
tratamiento algebraico está muy lejos del original de Descartes, pues usa ideas desar- 
rolladas en el siglo XIX. Pero antes de entrar de lleno a él, vale la pena enfatizar que 
no estamos abandonando el método axiomático iniciado por Euclides, simplemente 
cambiaremos de conjunto de axiomas: ahora nos basaremos en los axiomas de los 
números reales (ver la sección 1.3.1). De tal manera que los objetos primarios de 
Euclides (línea, segmento, distancia, ángulo, etc.) serán definiciones (por ejemplo, 
punto ya es “pareja ordenada de números” y plano es el conjunto de todos los pun- 
tos), y los cinco postulados serán teoremas que hay que demostrar. Nuestros objetos 
primarios básicos serán ahora los números reales y nuestra intuición geométrica pri- 
mordial es que forman una recta: La Recta Real, ¡R. Sin embargo, la motivación 
básica para las definiciones sigue siendo la intuición geométrica desarrollada por los 
griegos. No queremos hacernos los occisos como si no conocieramos la geometría 


— 
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griega; simplemente la llevaremos a nuevos horizontes con el apoyo del álgebra —el 
enfoque analítico— y para ello tendremos que reconstruirla. 


EJERCICIO 1.3 Encuentra diferentes puntos en el plano dados por sus coordenadas 
(por ejemplo, el (3,2), el (—1,5), el (0, —4), el (—1,-—2), el (1/2, —3/2)). 

EJERCICIO 1.4 Identifica los cuadrantes donde las parejas tienen signos determinados. 
EJERCICIO 1.5  ¿Cúales son las coordenadas de los vértices de un cuadrado de lado 2, 


centrado en el origen y con lados paralelos a los ejes? 


Ñ EJERCICIO 1.6  — ¿Cúales son las coordenadas de los vértices del octá- 
Y gono regular que incluye como vértices a los del cuadrado anterior? (Tienes 


== 


>u 


que usar el Teorema de Pitágoras.) 


0] ERCICIO 1.7 ¿Puedes dar las coordenadas de los vértices de un triángulo equilátero 
centrado en el origen? Dibújalo. (Usa de nuevo el Teorema de Pitágoras, en un triángulo 
rectángulo con hipotenusa 2 y un cateto 1). 


1.2.2 El espacio de dimensión n 


La posibilidad de extender con paso firme la geometría euclidiana a más de dos 
dimensiones es una de las aportaciones de mayor profundidad del método cartesiano. 

Aunque nos hayamos puesto formales en la sección anterior para demostrar una, 
correspondencia natural entre E? y R?, intuitivamente es muy simple. Al fijar los 
dos ejes coordenados —las dos direcciones preferidas— se 
llega de manera inequívoca a cualquier punto en el plano 
dando las distancias que hay que recorrer en esas direcciones 
para llegar a él. En el espacio, habrá que fijar tres ejes 
coordenados y dar tres números. Los dos primeros dan un 
punto en el plano (que podemos pensar horizontal, como el 
piso), y el tercero nos da la altura (que puede ser positiva 
o negativa). Si denotamos por R* al conjunto de todas las 
ternas (x,y,z) de números reales, como éstas corresponden 
a puntos en el espacio una vez que se fijan los tres ejes (el 
eje vertical se conoce como eje z), podemos definir el espacio 
euclidiano de tres dimensiones como R*, sin preocuparnos de axiomas. ¿Y por qué 
pararse en 3? ¿o en 4? 

Dado un número natural n € (1,2,3,...), denotamos por ¡R” al conjunto de todas 
las n-adas (léase “eneadas”) ordenadas de números reales (x1,X2,...,Xn). Formal- 
mente, 


== ER UL. Ts 


Para valores pequeños de n, se pueden usar letras x, y, z e inclusive w para denotar 
las coordenadas; pero para n general esto es imposible y no nos queda más que 
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usar los subíndices. Así, tenemos un conjunto bien definido, IR”, al que podemos 
llamar “espacio euclidiano de dimensión n” y hacer geometría en él. A una n-ada 
x= (x1,X2,...,Xn) € RR” se le llama vector o punto. 

El estudiante que se sienta incómodo con esto de “muchas dimensiones”, puede 
sustituir (pensar en) un 2 o un 3 siempre que se se use n y referirse al plano o al 
espacio tridimensional que habitamos para su intuición. No pretendemos en este libro 
estudiar la geometría de estos espacios de muchas dimensiones. Nos concentraremos 
en dimensiones 2 y 3, así que puede pensarse la n como algo que puede tomar valores 2 
o 3 y que resulta muy útil para hablar de los dos al mismo tiempo pero en singular. Sin 
embargo, es importante que el estudiante tenga una visión amplia y pueda preguntarse 
en cada momento ¿qué pasaría en 4 o más dimensiones? Como verá, y a veces 
señalaremos explícitamente, algunas cosas son muy fáciles de generalizar, y otras no 
tanto. Por el momento, basta con volver a enfatizar el amplísimo mundo que abrió el 
método de las coordenadas cartesianas para las matemáticas y la ciencia. 

Vale la pena en este momento puntualizar las convenciones de notación que uti- 
lizaremos en este libro. A los números reales los denotamos por letras simples, por 
ejemplo x, y, z, o bien a, b y co bien t, r y s; e inclusive conviene a veces utilizar 
letras griegas, a (alfa), f (beta) y y (gamma), o A (lambda) y u (mu) (por alguna 
razón hemos hecho costumbre de utilizarlas siempre en pequeñas familias). Por su 
parte, a los puntos o vectores los denotamos por letras en negritas, por ejemplo, p y 
q, para señalar que estamos pensando en su caracter de puntos, o bien, usamos u, v, 
w o d (acrónimo elegante que usaremos para “dirección”) y n (acrónimo para “nor- 
mal”) para subrayar su papel vectorial. Por supuesto, Xx, Y y Z siempre son buenos 
comodines para vectores (puntos o eneadas) variables o incógnitos, que no deben que 
confundirse con x, y, Z, que son variables reales o numéricas. 


1.3 El espacio vectorial ¡R? 


En esta sección se introduce la herramienta algebraica básica para hacer geometría 
con parejas, ternas o n-adas de números. Y de nuevo la idea central es muy simple: 
así como los números se pueden sumar y multiplicar, también los vectores tienen sus 
operacioncitas. Lo único que suponemos de los números reales es que sabemos o, 
mejor aún, que “saben ellos” sumarse y multiplicarse; a partir de ello extenderemos 
estas nociones a los vectores. 

Definición 1.3.1 Dados dos vectores u = (x,y) y v = 
(xy) en R?, definimos su suma vectorial, o simplemente 
su suma, como el vector u + v que resulta de sumar coor- 
denada a coordenada: 


u+v:=(x+ xy +94), 


es decir, 


(x, y) + (54) := (x+x y +4). 


x+y 
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Nótese que en cada coordenada, la suma que se usa es la suma usual de números 
reales. Así que al signo “+” de la suma le hemos ampliado el espectro de “saber sumar 
números” a “saber sumar vectores”; pero con una receta muy simple: “coordenada a 
coordenada”. Por ejemplo, 


(3,21+(21,1)=12,31. 


La suma vectorial corresponde geométricamente a la regla del 

u+v paralelogramo usada para encontrar la resultante de dos vectores. 
Esto es, se consideran los vectores como segmentos dirigidos que 

salen del origen, generan entonces un paralelogramo y el vector 

que va del origen a la otra esquina es la suma. También se puede 


v, ' Ae 
pensar como la acción de dibujar un vector tras otro, pensando que 
0 Ls los vectores son segmentos dirigidos que pueden moverse paralelos 
a sí mismos. 
Definición 1.3.2 Dados un vector u = (x,y) € R? y un número t € R se de- 
fine la multiplicación escalar tu como el vector que resulta de 
m7 tu multiplicar cada coordenada del vector por el número: 
u ty tu:=(tx,ty). 
y 
+ A Nótese que en cada coordenada, la multiplicación que se usa es 
la de los números reales. 
La multiplicación escalar corresponde a la dilatación o con- 
A añ tracción, y posiblemente al cambio de dirección, de un vector. 
2u Veamos. Está claro que 
u 
Ú > 2u = (2x,2y) =(x+x,y+y) =u+u, 
-u 


así que 2u es el vector “u seguido de u” o bien, “u dilatado a su doble”. De la misma 
manera que 3u es un vector que apunta en la misma dirección pero de tres veces su 
tamaño. O bien, es fácil deducir que (5)u, como punto, está justo a la mitad del 
camino del origen 0 = (0,0) a u. Así que tu para t > 1 es, estrictamente hablando, 
una dilatación de U, y para 0 <t< 1, una contracción del mismo. Por último, para 
t < 0, tu apunta en la dirección contraria ya que, en particular, (—1)u =: —u es el 
vector que, como segmento dirigido, va del punto u al O (puesto que u + (—u) = 0) 
y el resto se obtiene como dilataciones o contracciones de —u. 

No está de más insistir en una diferencia esencial entre las dos operaciones que 
hemos definido. Si bien la suma vectorial es una operación que de dos ejemplares de la 
misma especie (vectores) nos da otro de ellos, la multiplicación escalar involucra a dos 
objetos de diferente índole, por un lado el “escalar”, un número real, y por el otro un 
vector, lo que da como resultado un nuevo vector. Los vectores no se multiplican (por 
el momento), sólo los escalares (los números reales) saben multiplicarlos (pegarles, 
podría decirse) y les cambian con ello su “escala”. 
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EJERCICIO 1.8 Sean v] = (2,3), vz = (—1,2), v3 = (3, —1) y va = (1, 4). 

i) Calcula y dibuja: 2v1 — 3v2; 2(v3 —v4) — V3 + 2v4; 2v] — 3v3 + 2v4. 

ii) ¿Qué vector x € R?2 cumple que 2v¡ +x = 3v7;3v3 — 2x =v4 +x? 

iii) ¿Puedes encontrar r,s € R tales que Tv2 +Ssv3 =vV4? 

EJERCICIO 1.9 Dibuja el origen y tres vectores cualesquiera U, v y w en un papel. 
Con un par de escuadras encuentra los vectores U+V, V+W y Wu. 

EJERCICIO 1.10 Dibuja el origen y dos vectores cualesquiera u, v en un papel. Con 
regla (escuadras) y compás, encuentra los puntos (1/2) u>+(1/2)v, 2u—v, 3u—2v, 2v—u. 
¿Resultan colineales? 

EJERCICIO 1.11 Describe el subconjunto de R?, o lugar geométrico, definido por 
Lv :=[tv|teR). 


Estas definiciones se extienden a IR” de manera natural. Dados dos vectores 
x= (x1,...,Xn) y Y=(y1,...,UYn) en RR” y un número real t € RR, la suma vectorial 
(o simplemente la suma) y el producto (o multiplicación) escalar se definen como 
sigue: 


EV SAVIA 
Ei ER 


Es decir, la suma de dos vectores (con el mismo número de coordenadas) se obtiene 
sumando coordenada a coordenada y el producto por un escalar (un número) se 
obtiene multiplicando cada coordenada por ese número. 

Las propiedades básicas de la suma vectorial y la multiplicación escalar se reúnen 
en el siguiente teorema, donde el vector O = (0,...,0) es llamado vector cero que 
corresponde al origen, y, para cada x € R”, el vector —x := (—1)x se llama inverso 
aditivo de x. 


Teorema 1.2 Para todos los vectores X, Y, Z € IR” y para todos los números s, tE R 
se cumple que: 


1) (x+y)+2z=x+(y+2) 
1) x+y=y+X 

114) x+0=x 

iw) x+(=x)=0 

v) s(tx)= (st)x 

vi) Ix=x 

vii) t(x+4y) =tx+ty 
viti) (s+t)x=sx+tx 


1.3.1 ¿Teorema o axiomas? 


Antes de pensar en demostrar el teorema anterior, vale la pena reflexionar un poco 
sobre su carácter pues está muy cerca de ser un conjunto de axiomas y es sutil qué 
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quiere decir eso de demostrarlo. 

Primero, debemos observar que RR” tiene sentido para n = 1, y es simplemente 
una manera rimbombante de referirse a los números reales. Así que del teorema, 
siendo n = 1 (es decir, si x, y, z están en R), se obtiene parte de los axiomas de los 
números reales. Esto es, cada enunciado es una de las reglas elementales de la suma 
y la multiplicación que conocemos desde pequeños. Las propiedades (i) a (iv) son 
los axiomas que hacen a R, con la operación suma, lo que se conoce como un “grupo 
conmutativo”: (1) dice que la suma es “asociativa”, (1i) que es “conmutativa”, (111) 
que el 0 —o bien, el número 0— es su “neutro” (aditivo) y (iv) que todo elemento 
tiene “inverso” (aditivo). Por su parte, (v) y (vi) nos dicen que la multiplicación 
es asociativa y que tiene un neutro (multiplicativo), el 1; pero nos faltaría que es 
conmutativa y que tiene inversos (multiplicativos). Entonces tendríamos que añadir: 


ix) ts=st 
x) SitX0, existet? tal que tt! =1 


para obtener que R — (0) (los reales sin el 0) son un grupo conmutativo con la mul- 
tiplicación. Finalmente, (vii) y (viii) ya dicen lo mismo (en virtud de (ix)), que las 
dos operaciones se distribuyen. Estos axiomas definen lo que se llama un campo. 

Obsérvese que en el caso general (n > 1) (ix) y (x) ni siquiera tienen sentido; pues 
sólo cuando n = 1 la multiplicación escalar involucra a seres de la misma especie. 
En resumen, para el caso n = 1, el teorema es un subconjuto de los axiomas que 
definen las operaciones de los números reales. No hay nada que demostrar, pues son 
parte de los axiomas básicos que vamos a usar. El resto de los axiomas que definen 
los números reales se refieren a su orden y, para que el libro quede autocontenido, de 
una vez los enunciamos. Los números reales tienen una relación de orden, denotada 
por < y que se lee “menor o igual que” que cumple, para a,b,c,d € RR, con: 


Oi) a<b o b<a (es un orden total) 
04) a<b y béiía e. a=b 
Oiii) a<b y b<c => as<c (es transitivo) 
Oiv) a<b y c<d > a+c<b+d 
Ov) a<b y O<c =>  ac<be 


Además, los números reales cumplen con el axioma del supremo que, intuitivamente, 
dice que la recta numérica no tiene “hoyos”, que los números reales forman un con- 
tinuo. Pero este axioma, fundamental para el cálculo pues hace posible formalizar lo 
“infinitesimal”, no se usa en este libro, así que lo dejamos de lado. 

Regresando al Teorema 1.2, para n > 1 la cosa es sutilmente diferente. Nosotros 
definimos la suma vectorial, y al ser algo nuevo sí tenemos que verificar que cumple 
las propiedades requeridas. Vale la pena introducir a Dios, el de las matemáticas no 
el de las religiones, para que quede claro. Dios nos da los números reales con la suma 
y la multiplicación, de alguna manera nos “ilumina” y de golpe: ahí están, con todo y 
sus axiomas. Ahora, nosotros —simples mortales— osamos definir la suma vectorial 
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y la multiplicación de escalares a vectores, pero Dios ya no nos asegura nada, él ya 
hizo lo suyo: nos toca demostrarlo a nosotros. 

Demostración. (del Teorema 1.2) Formalmente sólo nos interesa demostrar el teo- 
rema para n = 2, 3, pero esencialmente es lo mismo para cualquier n. La demostración 
de cada inciso es muy simple, tanto así que hasta confunde, y consiste en aplicar el 
axioma correspondiente que cumplen los números reales coordenada a coordenada y 
la definición de las operaciones involucradas. Sería muy tedioso, y aportaría muy 
poco al lector, demostrar los ocho incisos, así que sólo demostraremos con detalle el 
primero para R?, dejando los demás y el caso general como ejercicios. 

i) Sean x, y, z € R?, entonces x = (x1, Xx2), y = (y1, ya) y z = (21, 22), donde 
cada Xi, Yi y 2 (i = 1,2) son números reales (nótese que conviene usar subíndices 
con la misma letra que en negritas denota al vector). Tenemos entonces, a partir de 
la definición de suma vectorial, que 


(+ Y) +2=(x1 +41, 2 +42) + (21, 22) 
y usando nuevamente la definición se obtiene que esta última expresión es 
= ((a +41) +21, (x2 +42) +22). 


Luego, como la suma de números reales es asociativa (el axioma correspondiente de 
los números reales usado coordenada a coordenada) se sigue 


= (a + (y1 +21), x2 + (y2 +22)). 
Y finalmente, usando dos veces la definición de suma vectorial, se obtiene 


= (x1, Xx2) + (y1 +21, Ya +22) 
= 5) + lui, yl+ laz) 
x+(y +2), 


lo que demuestra que (x+ y) +z =x+(y +2); y entonces tiene sentido escribir 
X+U+Z. O 


Se conoce como espacio vectorial a un conjunto en el que están definidas dos opera- 
ciones (suma vectorial y multiplicación escalar) que cumplen con las ocho propiedades 
del Teorema 1.2. De tal manera que este teorema puede parafrasearse “IR” es un es- 
pacio vectorial”. ¿Podría el lector mencionar un espacio vectorial distinto de RR”? 


EJERCICIO 1.12 Usando los axiomas de los números reales, así como las definiciones 
de suma vectorial y producto escalar, demuestra algunos incisos del Teorema 1.2 para el 
caso n =2 y n= 3. ¿Verdad que lo único que cambia es la longitud de los vectores, pero 
los argumentos son exactamente los mismos? Demuestra (aunque sea mentalmente) el caso 
general. 
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EJERCICIO 1.13 Demuestra que si a < 0 entonces 0 < —a. (Usa el axioma (Oiv).) 


EJERCICIO 1.14 Observa que los axiomas de orden no dicen nada sobre cómo están 
relacionados el 0 y el 1, pero se pueden deducir de ellos. Supón que 1 < 0, usando el 
ejercicio anterior y los axiomas (Ov) y (Oii), demuestra que entonces —1 = 0; como esto 
no es cierto se debe cumplir la otra posibilidad por (Oi), es decir, que 0 < 1. 


EJERCICIO 1.15 Demuestra que si a <b y c < 0 entonces ac > bc (donde > significa 
“es mayor o igual”). 


Ejemplo. Como corolario de este teorema se tiene que el “algebra” simple a la 
que estamos acostumbrados con números también vale con los vectores. Por ejemplo, 
en el ejercicio (1.8.1i.b) se pedía encontrar el vector x tal que 


3v3 —2x =V4 +X. 


Hagámoslo. Se vale pasar con signo menos del otro lado de la ecuación (sumando 
el inverso aditivo a ambos lados), y por tanto esta ecuación equivale a 


—3X = V4 — 3V3 
y multiplicando por —1/3 se obtiene que 
x =v3 — (1/3)v,. 


Ya nada más falta sustituir por los valores dados. Es probable que el estudiante 
haya hecho algo similar y qué bueno: tenía la intuición correcta. Pero hay que tener 
cuidado, así como con los números no se puede dividir entre cero, no se le vaya a 
ocurrir tratar de ¡dividir entre un vector! Aunque a veces se pueden “cancelar” (ver 
Ej. 1.17). Para tal efecto, el siguiente lema será muy usado y vale la pena verlo en 
detalle. 


Lema 1.3 Six € RR? yteR son tales que tx =0 entonces t=00x=0. 


Demostración. Suponiendo que t % 0, hay que demostrar que x = Ó para com- 
pletar el lema. Pero entonces t tiene inverso multiplicativo y podemos multiplicar 
por t? ambos lados de la ecuación tx = O para obtener (usando (vw) y (vi)) que 
== (54) 0 =0 por la definición del vector nulo O = (0, 0). 


EJERCICIO 1.16 Demuestra que six € RÍ y t € R son tales que tx = 0 entonces t =0 
ox=0. ¿Y para IR”? 

EJERCICIO 1.17 Demuestra que si x € R” es distinto de O, y t, s € IR son tales que 
tx = sx, entonces t =s. (Es decir, si x 4 O está permitido “cancelarlo” aunque sea 
vector.) 
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1.4 Líneas 


En el estudio de la geometría clásica, las líneas o rectas son subconjuntos básicos 
descritos por los axiomas; se les reconoce intuitivamente y se parte de ellas para 
construir lo demás. Con el método cartesiano, esto no es necesario. Las líneas se 
pueden definir o construir, correspondiendo a nuestra noción intuitiva de ellas —que 
no varía en nada de la de los griegos—, para después ver que efectivamente cumplen 
con los axiomas que antes se les asociaban. En esta sección, definiremos las rectas y 
veremos que cumplen los axiomas primero y tercero de Euclides. 

Nuestra definición de recta estará basada en la intuición física de una partícula 
que viaja en movimiento rectilíneo uniforme; es decir, con velocidad fija y en la 
misma dirección. Estas dos nociones (velocidad como magnitud y dirección) se han 
amalgamado en el concepto de vector. 

Recordemos que en el Ejercicio 1.11, se pide describir el con- 


junto £, := (tv € R? |t e R) donde v € R?. Debía ser claro que y 
si v % 0, entonces £,, al constar de todos los múltiplos escalares o 
del vector v, se dibuja como una recta que pasa por el origen 0 


(pues 0 = 0v) con la dirección de v. Si consideramos la variable 

t como el tiempo, la función qp(t) = tv describe el movimiento rectilíneo uniforme 
de una partícula que viene desde tiempo infinito negativo, pasa por el origen O en 
el tiempo t = 0 (llamada la posición inicial), y seguirá por siempre con velocidad 
constante v. 

Pero por el momento queremos pensar en las rectas como conjuntos (en el capítulo 
siguiente estudiaremos más a profundidad las funciones). Los conjuntos £y, al rotar 
v, nos dan las rectas por el origen, y para obtener otras, bastará “empujarlas” fuera 
del origen (o bien, arrancar el movimiento con otra posición inicial). 


Definición 1.4.1 Dados un punto p y un vector v % O, la recta 
que pasa por p con dirección v es el conjunto: 


l:o=([p+tv|teR). (1.1) 


Una recta o línea en R? es un subconjunto que tiene, para algún 
py v O, la descripción anterior. 


0 


A esta forma de definir una recta se le conoce como representación o expresión 
paramétrica. Esta representación trae consigo una función entre los números reales y 
la recta: 


p:R —>R? 
p(t) =p +tv. 


(1.2) 


De hecho, esta función define una biyección entre R y f. Como f se definió por 
medio del parámetro t € RR, es claro que es la imagen de la función «q; es decir, q es 
sobre. Demostremos (aunque de la intuición física parezca obvio) que es uno-a-uno. 
Supongamos para esto que p(t) = qp(s) para algunos t,s € R y habrá que concluir 
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que t =s. Por la definición de q se tiene 
p+tv=p+sv. 


De aquí, al sumar el inverso del lado izquierdo a ambos (que equivale a pasarlo de un 
lado al otro con signo contrario) se tiene 


0 = p+sv—(p+tv) 
= p+sv—p-tv) 
(p — p) + (sv—tv) 
0+ (s—t)v 

= (s—t)v, 


donde hemos usado las propiedades (1), (11), (111), (iv) y (viii) del Teorema 1.2.2 Del 
Lema 1.3, se concluye que s —t=0 o bien que v= 0. Pero por hipótesis v 4 O (esto 
es la esencia), así que no queda otra que s =t. Esto demuestra que es inyectiva, y 
nuestra intuición se corrobora. 

Hemos demostrado que cualquier recta está en biyección natural con KR, la recta 
modelo, así que todas las líneas son una “copia” de la recta real abstracta KR. 


Observación 1.4.1 En la definición 1.4, así como en la demostración, no se usa de 
manera esencial que p y v estén en R?. Sólo se usa que hay una suma vectorial y un 
producto escalar bien definidos. Así que el punto y el vector podrían estar en R* o en 
R”. Podemos entonces dar por establecida la noción de recta en cualquier dimensión 
al cambiar 2 por n en la Definición 1.4. 


Observación 1.4.2 A la función 1.2 se le conoce como “movimiento rectilíneo uni- 
forme” o “movimiento inercial”, pues, como decíamos al principio de la sección, 
describe la manera en que se mueve una partícula, o un cuerpo, que no está afectada 
por ninguna fuerza y tiene posición p y vector velocidad v en el tiempo t = 0. 

Ya podemos demostrar un resultado clásico, e intuitivamente claro. 


Lema 1.4 Dados dos puntos p y q en R”, existe una recta que pasa por ellos. 


Demostración. Si tuvieramos que p = q, como hay muchas rectas que pasan 
por p, ya acabamos. Supongamos entonces que p % q, que es el caso interesante. 
Si tomamos a p como punto base para la recta que buscamos, 


L q bastará encontrar un vector que nos lleve de p a q, para tomarlo 
Maio 00 como dirección. Este es la diferencia q — p, pues claramente 


pP+(q-p)=q, 


2 Ésta es la última vez que haremos mención explícita del uso del Teorema 1.2; de aquí en adelante 
se aplicarán sus propiedades como si fueran lo más natural del mundo. Pero vale la pena que 
el estudiante se cuestione por algún tiempo qué es lo que se está usando en las manipulaciones 
algebraicas. 
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de tal manera que si definimos d := q — p, como dirección, la recta 


l=(p+td|teR), 


(que sí es una recta pues d = q —p % 0), es la que funciona. Con t = 0 obtenemos 
que p € fl, y con t=1 que q € l. 1 


De la demostración del lema, se siguen los postulados 1 y III de Euclides. Obsérvese 
que cuando t toma valores entre 0 y 1, se obtienen puntos entre p y q (pues el vector 
direccional (q — p) se encoge al multiplicarlo por t), así que 
el segmento de p a q, que denotaremos por Pq, se debe 

4 t>ll q 
definir como 


Pdq:= ip +t(q-p)l0<t<l). t=0 *<0 


Y la recta l que pasa por p y q se extiende “indefinidamente” a ambos lados del 
segmento pd; para t > 1 del lado de q y para t < 0 del lado de p. 


“EJERCICIO 1.18 Aunque lo demostraremos más adelante, es un buen ejercicio 
demostrar formalmente en este momento que la recta fl, cuando p X q, es única. 
EJERCICIO 1.19 Encuentra representaciones paramétri- 
cas de las rectas en la figura. Observa que su representación 
paramétrica no es única. 


EJERCICIO 1.20 Dibuja las rectas 


(2,3+t(1,1) | teRjh; 
(21,0 +s(2,1) | seR; 
[(0,—2) + [—r,2r) | reRj; 
[(t-1,-2t) | teR) 


EJERCICIO 1.21 Exhibe representaciones paramétricas para las seis rectas qué pasan 
por dos de los siguientes puntos en R?: py = (2,4), p2 = (-1,2), p3 = (-1,-1) y pa = 
EJERCICIO 1.22 Muestra representaciones paramétricas para las tres rectas que genera 
el triángulo en R*: q1 = (2,1,2), q2 = (-1,1,—1), q3 = (-1,-2,-—1). 

EJERCICIO 1.23 Si una partícula viaja de 2q1 a 3q3 en movimiento inercial y tarda 
cuatro unidades de tiempo en llegar. ¿Cuál es su vector velocidad? 

EJERCICIO 1.24 Dados dos vectores u y ven R", el paralelogramo 

que definen tiene como vértices los puntos 0,u, v y u +v (como en la 

figura). Demuestra que sus diagonales, es decir, los segmentos de O a 

u +1 y de u a y se intersectan en su punto medio. 
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1.4.1 Coordenadas baricéntricas 


Todavía podemos exprimirle más información a la demostración del Lema 1.4. Vere- 
mos cómo se escriben, en términos de p y q, los puntos de su recta, y que esto tiene 
que ver con la clásica ley de las palancas. Además, de aquí surgirá una demostración 
muy simple del teorema clásico de concurrencia de medianas en un triángulo. 

Supongamos que p y q son dos puntos distintos del plano. Para cualquier t € R, 
se tiene que 


p+t(q-p) = p+tq—tp 
(1—t)p+tg 


al reagrupar los términos. Y esta última expresión, a su vez, se puede reescribir como 
sp+tq con s+t=1, 


donde hemos introducido la nueva variable s = 1—t. De lo anterior se deduce que la 
recta l que pasa por p y q puede también describirse como 


l=(sp+tqls+t=1), 


que es una expresión baricéntrica de l. A los números s,t (con s+1t = 1, insistimos) 
se les conoce como coordenadas baricéntricas del punto x = sp +tq con respecto a 
Pp y q. 

Las coordenadas baricéntricas tienen la ventaja de que ya no distinguen entre 
los dos puntos. Como lo escribíamos antes —sólo con t—, p era el punto base (“el 
que la hace de 0”) y luego q era hacia donde íbamos (“el que la hace de 1”), y 
tenían un papel distinto. Ahora no hay preferencia por ninguno de los dos; las co- 
ordenadas baricéntricas son “democráticas”. Más aún, al expresar una recta con 
coordenadas baricéntricas no le damos una dirección preferida. Se usan simultánea- 
mente los parámetros naturales para las dos direcciones (de p a q y de q a p); pues 
si s+t=1l entonces 


sp+tq = p+t(q—p) 
q +s(p- q). 
Nótese que x = sp + tq está en el segmento entre p y q si y sólo si sus dos 


coordenadas baricéntricas son no negativas, es decir, si y sólo si 
t>0ys>0. Por ejemplo, el punto medio tiene coordenadas 


q 
baricéntricas 1/2, 1/2, es (1/2)p+(1/2)q; y el punto que divide 
a p al segmento de p a q en la proporción de 2/3 a 1/3 se escribe 
(1/2)Q+(1/2)p (1/3)p + (2/3)q, pues se acerca más a q que a p. La extensión 


de la recta más allá de q tiene coordenadas baricéntricas s,t 


q 
(1/3)Q+ (2/3)p con s < 0 (y por lo tanto t > 1); así que los puntos de £ fuera 
Q p del segmento de p a q tienen alguna coordenada baricéntrica 
(2/3)9+(1/3)p negativa (la correspondiente al punto más lejano). 
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En términos físicos, podemos pensar la recta por p y q como una barra rígida. Si 
distribuimos una masa (que podemos pensar unitaria, es decir 
que vale 1) entre estos dos puntos, el punto de equilibrio tiene p 4 
las coordenadas baricéntricas correspondientes a las masas. Si, d MA 
por ejemplo, tienen el mismo peso, su punto de equilibrio está en ——F A 
el punto medio. Las masas negativas pueden pensarse como una 
fuerza hacia arriba y las correspondientes coordenadas baricén- --. ——————_—4-—— 
tricas nos dan entonces el punto de equilibrio para las palancas. 
Veamos ahora un teorema clásico cuya demostración se sim- 4. 
plifica enormemente usando coordenadas baricéntricas. Dado 113 45 
un triángulo con vértices A, b, c, se definen las medianas como 
los segmentos que van de un vértice al punto medio del lado 
opuesto a éste. 


Teorema 1.5 Dado un triángulo A, b, C, sus tres medianas “concurren” en un punto 
que las parte en la proporción de 2/3 (del vértice) a 1/3 (del lado opuesto). 


Demostración. Como el punto medio del segmento b, c es (3 b+ o Cc), entonces la ...Dibujo 
mediana por a es el segmento 


1 1 
(sa+t (5 b+>5 c)[s+t=1,5>0,t>0), 
y análogamente se describen las otras dos medianas. Por suerte, el enunciado del 
teorema nos dice dónde buscar la intersección: el punto que describe en la mediana 
de A es precisamente 


1 2 1 1 1 1 
de 369+39=307 39+3e E 
Entonces, de las igualdades > 
A A E >, 
E AS YA 
1 2d 1 Cc 
e 
1 221 1 
= gan 334 3D) 


se deduce que las tres medianas concurren en el punto l(a+b+ Cc), es decir, pasan por 
él. Este punto se llama el baricentro del triángulo, y claramente parte a las medianas 
en la proporción deseada. De nuevo, el baricentro corresponde al “centro de masa” o 
“punto de equilibrio” del triángulo. 
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O 


EJERCICIO 1.25 Si tienes una barra rígida de un metro y con una fuerza de 10 kg 
quieres levantar una masa de 40 kg, ¿de dónde debes colgar la masa, estando el punto de 
apoyo al extremo de tu barra? Haz un dibujo. 


EJERCICIO 1.26 Sean a, b y c tres puntos distintos entre sí. Demuestra que si a está 
en la recta que pasa por b y c, entonces b está en la recta por a y Cc. 


EJERCICIO 1.27 Encuentra el baricentro del triángulo a = (2,4), b = (-1,2), ec = 
(-1,—1). Haz un dibujo. 

EJERCICIO 1.28 Observa que en el Teorema 1.5, así como en la discusión que le 
precede, nunca usamos que estuviéramos en el plano. ¿Podría el lector enunciar y demostrar 
el teorema análogo para tetraedros en el espacio? (Un tetraedro está determinado por 
cuatro puntos en el espacio tridimensional. ¿Dónde estará su centro de masa?) ¿Puede 
generalizarlo a más dimensiones? 


1.4.2 Planos en el espacio I 


En la demostración del Teorema de las Medianas (1.5) se usó una idea que podemos 
utilizar para definir planos en el espacio. Dados tres puntos a, b y c en R* (aunque 
debe observar el lector que nuestra discusión se generaliza a R”), ya sabemos describir 
las tres líneas entre ellos; supongamos que son distintas. Entonces podemos tomar 
nuevos puntos en alguna de ellas y de estos puntos las nuevas líneas que los unen al 
vértice restante (como lo hicimos del punto medio de un segmento al vértice opuesto 
en el teorema). Está claro que la unión de todas estas líneas debe ser el plano que 
pasa por A, b y c; ésta es la idea que vamos a desarrollar. 
Un punto y en la línea por A y b se escribe como 


y=sa+tb con s+t=1. 


Y un punto x en la línea que pasa por y y C se escribe 
entonces como 


x=r(sa+tb)+(1l—1)c, 


para algún r € IR; que es lo mismo que 


x=(rs)a+(rt) b+ (1—r) c. 
Observemos que los tres coeficientes suman uno: 


(rs) + (rt) + (1-1) =r(s +t)+1-r=r(1)+1-r=1. 
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Y lo mismo hubiera pasado si en lugar de haber empezado con a y b, hubiéramos 
comenzado con otra de las parejas. De lo que se trata entonces es que cualquier 
combinación de A, b y ce con coeficientes que sumen uno debe estar en su plano. 
Demostraremos que está en una línea por uno de los vértices y un punto en la línea 
que pasa por los otros dos. 

Sean a, (3, y ER tales que «+ 3 + y = 1. Consideremos al punto 


x=0qua+pb+yc. 


Como alguno de los coeficientes es distinto de 1 (si no, sumarían 3), podemos suponer 
sin pérdida de generalidad (esto quiere decir que los otros dos 
casos son análogos) que « 4 1. Entonces podemos dividir 
entre 1 — ax y se tiene 


x=0aa+(l—a) TO X El, 
l—-a la 
así que X está en la recta que pasa por a y el punto 5 
a<0 
ES B b Le En este caso: B>0 


Como a+ fB+y = 1, entonces B+y = 1— a, y los coeficientes 
de esta última expresión suman uno. Por lo tanto y está en la recta que pasa por b 
y C. Hemos argumentado la siguiente definición: 


Definición 1.4.2 Dados tres puntos a, b y c en R* no colineales (es decir, que no 
estén en una misma línea), el plano que pasa por ellos es el conjunto 


T=(aa+pb+ycla, Pp, yEeR; a+ B+y=1). 


A una expresión de la forma xa + fb + ye con a+ + y = 1 la llamaremos 
combinación afín (o baricéntrica) de los puntos a, b, e y a los coeficientes ax, B, y 
las coordenadas baricéntricas del punto xaa+fb+yc. 


EJERCICIO 1.29 Considera tres puntos a, b y c no colineales, y sean ax, f y y las 
correspondientes coordenadas baricéntricas del plano que generan. Observa que cuando una 
de las coordenadas baricéntricas es cero, entonces el punto correspondiente está en una de 
las tres rectas por A, b y c. ¿En cuál?, ¿puedes demostrarlo? Haz un dibujo de los tres 
puntos y sus tres rectas. Éstas parten el plano en pedazos (¿cuántos?); en cada uno de ellos 
escribe los signos que toman las coordenadas baricéntricas (por ejemplo, en el interior del 
triángulo se tiene (+,+, +) que corresponden respectivamente a (x, B,y)). 


EJERCICIO 1.30 Dibuja tres puntos Aa, b y c no colineales. Con regla y compás 
encuentra los puntos x = (1/2)Ja + (1/4)b+(1/4c, y = (1/4a + (1/2)b + (1/4) e y 
z = (1/4a+(1/4)b + (1/2) c. Describe y argumenta tu construcción. Supón que puedes 
partir en tres el segmento bc (hazlo midiendo con una regla o a ojo). ¿Puedes construir los 
puntos u = (1/2)Ja+ (1/3)b+ (1/6) e y v=(1/2)a+ (1/6) b + (1/3) e? 
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EJERCICIO 1.31 Demuestra que si u y v no son colineales con el origen, entonces el 
conjunto ([su+tv|s,t e R jes un plano por el origen. (Usa que su+tv=r0+su-+tv 
para cualquier r, s, t € R). 

EJERCICIO 1.32 Demuestra que si p y q están en el plano IT de la Definición 1.4.2, 
entonces la recta que pasa por ellos está contenida en TI. 


Definición lineal 


Emocionado el autor por su demostración del teorema de medianas (1.5) usando 
coordenadas baricéntricas, se siguió de largo y definió planos en el espacio de una 
manera quizá no muy intuitiva. Que quede entonces la sección anterior como ejercicio 
en la manipulación de combinaciones de vectores; si no quedó muy clara puede releerse 
después de ésta. Pero conviene recapitular para definir los planos de otra manera, 
para aclarar la definición y así dejarnos la tarea de demostrar una equivalencia de dos 
definiciones. 

La recta que genera un vector u % O es el conjunto de todos sus “alargamien- 
tos” Ly =fsul|s € Rj). Si ahora tomamos un nuevo vector v que no esté en £.,, 
tenemos una nueva recta L, =([tv|t € R) 
que intersecta a la anterior sólo en el origen. 
Estas dos rectas generan un plano que con- 
siste en todos los puntos (en R*, digamos, 
para fijar ideas) a los cuales se puede llegar 
desde el origen moviéndose únicamente en 
las direcciones Uu y V. Este plano que pasa, 
por el origen claramente se describe con dos 
parámetros independientes: 


Mo =[su+tv]|s,teR), 


que por su propia definición está hecho a 
imagen y semejanza del plano R? (ver Ejer- 
cicio 1.33, adelante). Como lo hicimos con 
las rectas, podemos definir ahora un plano cualquiera como un plano por el origen (el 
que acabamos de describir) trasladado por cualquier otro vector constante. 


Definición 1.4.3 Un plano en R* es un conjunto de la forma 


M=(p+su+tvl|s,telkR), 


donde u y v son vectores no nulos tales que £, N £L,y = (0) y p es cualquier punto. 
A esta manera de describir un plano la llamaremos expresión paramétrica; a U y V 
se les llama vectores direccionales del plano IT y a p el punto base de la expresión 
paramétrica. 
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Para no confundirnos entre las dos definiciones de plano que hemos dado, llamemos 
plano afín a los que definimos en la sección anterior. Y ahora demostremos que las 
dos definiciones coinciden. 


Lema 1.6 En R?, todo plano es un plano afín y viceversa. 


Demostración. Sea Il como en la definición precedente. Debemos encontrar 
tres puntos en él y ver que todos los elementos de TI se expresan como combinación 
baricéntrica de ellos. Los puntos más obvios son 


a:=p;b:=p+u; c:=p+vw, 
que claramente están en TI. Obsérvese que entonces 


se tiene que u =b-— a y v= c— a, de tal manera 
que para cualquier s,t € ¡R tenemos que 


p+su+tv = a+s[(b-a)+t(c-a) 
= a+sb-sa+te-ta 
(l|—=s—-ta+sb+tc. 


Puesto que los coeficientes de esta última expresión suman 1, esto demuestra que 
TT está contenido en el plano afín generado por a, b, c. E inversamente, cualquier 
combinación afín de a, b, e tiene esta última expresión, y por la misma igualdad se 
ve que está en TI. Obsérvese finalmente que si nos dan tres puntos a, b, c, se pueden 
tomar como punto base a A y como vectores direccionales a (b— a) y (c— a) para 
expresar paramétricamente el plano afín que generan, pues las igualdades anteriores 
se siguen cumpliendo. 

Ver que las condiciones que pusimos en ambas definiciones coinciden se deja como 
ejercicio. O 


Antes de seguir adelante, conviene establecer cierta terminología y notación 
para cosas, nociones y expresiones que estamos usando mucho: 


e Dados los vectores u¡,uz,...,u en R” (para incluir nuestros casos de interés 
n = 2,3 de una buena vez), a una expresión de la forma 


S¡Uy + $747 +: ++ + SxUz, 
donde s1,82,...,Sx son números reales (escalares), se le llama una combinación 
lineal de los vectores U¡,U>,...,U, con coeficientes S1,S>2,...,Sk. Obsérvese 


que toda combinación lineal da como resultado un vector, pero que un mismo 
vector tiene muchas expresiones tales. 
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e Como ya vimos, a una combinación lineal cuyos coeficientes suman 1 se le llama 
combinación afín. Y a una combinación afín de dos vectores distintos o de tres 
no colineales se le llama, además, baricéntrica. 


e Al conjunto de todas las combinaciones lineales de los vectores Uy, Uz,... , Uz se 
le llama el subespacio generado por ellos y se le denotará (u¡,uz,...,ux). Es 
decir, 

(Uu¡,Uz,..., Ux) := [s Uy + s2) +>**+SiUr | s],S2,...,S: ER). 


Nótese que entonces, si u 4 O se tiene que Ly = (u) es la recta generada por 
u; y ambas notaciones se seguirán usando indistintamente. Aunque ahora (u) 
tiene sentido para u = 0, en cuyo caso (u) =(0), y £,, se usará para destacar 
que es una recta. 


e Se dice que dos vectores u y v son linealmente independientes si son no nulos y 
tales que Ly MN £y =(0). 


e Dado cualquier subconjunto A CR”, su trasladado por el vector (o al punto) 
p es el conjunto 


A+p=p+A:=[(x+pIxecAj). 


Podemos resumir entonces nuestras dos definiciones básicas como: una recta es 
un conjunto de la forma l = p + (u) con u % 0; y un plano es un conjunto de la 
forma TT = p + (u, v) con u y v linealmente independientes. 


EJERCICIO 1.33 Demuestra que si u y v son linealmente independientes, entonces la 
función f : R? — RY definida por f (s,t) =su-+tv es inyectiva. 

EJERCICIO 1.34 Demuestra que cualquier plano está en biyección con R?. 
EJERCICIO 1.35 Demuestra que tres puntos a, b, e son no colineales si y sólo si los 
vectores u := (b — a) y v:= (ec — a) son linealmente independientes. 

EJERCICIO 1.36 Da una expresión paramétrica para el plano que pasa por los puntos 
a= (05-12), b == (1, 1,0) yec= [=1,0,2). 

EJERCICIO 1.37 Demuestra que O0 € (u¡,uz,...,Ux) para cualquier u¡,uz,..., uz en 
R”, 

EJERCICIO 1.38 Demuestra que dos vectores u y v son linealmente independientes si y 
sólo si la única combinación lineal de ellos que da 0 es la trivial (i.e., con ambos coeficientes 
cero). 


EJERCICIO 1.39 Demuestra que 


weluv € w+(uv=(uv + (uv, w)=(u,v). 
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1.5 Medio Quinto 


Regresemos al plano. Ya tenemos la noción de recta, y en esta sección veremos que 
nuestras rectas cumplen con la parte de existencia del quinto postulado de Euclides, 
que nuestra intuición va correspondiendo a nuestra formalización analítica de la 
geometría y que al cambiar los axiomas de Euclides por unos más básicos (los de 
los números reales) obtenemos los anteriores, pero ahora como teoremas demostra- 
bles. Ya vimos que por cualquier par de puntos se puede trazar un segmento que se 
extiende indefinidamente a ambos lados (axiomas 1 y III), es decir, que por ellos pasa 
una recta. El otro axioma que involucra rectas es el Quinto e incluye la noción de 
paralelismo, así que tendremos que empezar por ella. 

Hay una definición conjuntista de rectas paralelas, asi que formalicémosla. Como 
las rectas son, por definición, ciertos subconjuntos distinguidos del plano, tiene sentido 
la siguiente: 


Definición 1.5.1 Dos rectas l; y l, en R? son paralelas, que escribiremos fl; ||£2, si no 
se intersectan, es decir si 


tits 


donde /) denota al conjunto vacío (ver Apéndice A). 


Pero además de rectas tenemos algo más elemental que son los vectores (seg- 
mentos dirigidos) y entre ellos también hay una noción intuitiva de paralelismo que 
corresponde al “alargamiento” o multiplicación por escalares. 


Definición 1.5.2 Dados dos vectores u, v € R? distintos de O, diremos que u es 
paralelo a v, lo que escribiremos ul|v, si existe un número t € R tal que u = tv. 


Hemos eliminado el vector O, el origen, de la definición para no complicar la 
situación. Si lo hubiéramos incluido no es cierto el siguiente ejercicio. 


EJERCICIO 1.40 Demuestra que la relación “ser paralelo a” es una relación de equiv- 
alencia en R? —(0) (en el plano menos el origen llamado el “plano agujerado”). Describe 
las clases de equivalencia. (En el Apéndice A se define relación de equivalencia.) 


EJERCICIO 1.41 Sean u,v dos vectores distintos de 0. Demuestra que: 


ulv S Lun£, 410) Lu = £Lv. 


EJERCICIO 1.42 Demuestra que la relación entre rectas “ser paralelo a” es simétrica 
pero no reflexiva. 


EJERCICIO 1.43 Demuestra que dos rectas horizontales, es decir, con vector direccional 
d = (1,0), o son paralelas o son iguales. 


Con la noción de paralelismo de vectores, podemos determinar cuándo un punto 
está en una recta. 
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Lema 1.7 Sea l la recta que pasa por p con dirección d (d 4 0), y sea q 4 Pp, 


entonces 
qelt S (q-p)l d. 
E Demostración. "Tenemos que q € fl si y sólo si existe una 
t ER tal que 
p qa=p+td. 
Pero esto es equivalente a que q — p = td, que por definición es 
EA 7 que q —P es paralelo a d. O 


Teorema 1.8 (1/2 Quinto) Sean l una recta en R? y q un punto fuera de ella, 
entonces existe una recta l' que pasa por q y es paralela a l. 


Demostración. Nuestra definición de recta nos da un punto p y un vector 


dirección d 4 O para l, de tal manera que 


l=(p+td|teR). 


Es intuitivamente claro —y a la intuición hay que seguirla pues 


es, de cierta manera, lo que ya sabíamos— que la recta paralela 
o deseada debe tener la misma dirección, así que definamos 
L (=[(q+sd|seR). 


Como q € /, nos falta demostrar que £[|0, es decir, que LN l = (. Para lograrlo, 
supongamos que no es cierto, es decir, que existe x € LN ('. Por las expresiones 


paramétricas de l y l”, se tiene entonces que existen t € 
x=p+tdyx=q+sd. De aquí se sigue que 
q+sd = p+td 
q4a-p = td-sd 
q =P (t — s) d, 


R ys € 


R para las cuales 


y entonces q € l por el lema anterior, que es una contradicción a las hipótesis del 
teorema. Dicho de otra manera, como demostramos que LN 4 4 () implica que q € l, 
podemos concluir que si q  l, como en la hipótesis del teorema, no puede suceder 
que £f! sea no vacío, y por lo tanto LN 4! = () y £||4 por definición. Lo cual concluye 


con la parte de existencia del Quinto Postulado. 


O 
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La parte que falta demostrar del Quinto es la unicidad, es decir, que cualquier 
otra recta que pase por q sí intersecta a l; que la única paralela es ('. Esto se sigue 
de que rectas con vectores direccionales no paralelos siempre se intersectan, pero 
pospondremos la demostración formal de este hecho hasta tener más herramientas 
conceptuales. En particular, veremos en breve cómo encontrar la intersección de 
rectas para ejercitar la intuición, pero antes de entrarle, recapitulemos sobre la noción 
básica de esta sección, el paralelismo. 


De la demostración del teorema se sigue que dos rectas con la misma dirección 
(o, lo que es lo mismo, con vectores direccionales paralelos) o son la misma o no se 
intersectan. Conviene entonces cambiar nuestra noción conjuntista de paralelismo a 
una vectorial. 


Definición 1.5.3 Dos rectas fl; y l, son paralelas, que escribiremos 21 ||£, si tienen 
vectores direccionales paralelos. 


Con esta nueva definición (que es la que se mantiene en lo sucesivo) una recta es 
paralela a sí misma, dos rectas paralelas distintas no se intersectan (son paralelas en 
el viejo sentido) y la relación es claramente transitiva. Así 
que es una relación de equivalencia y las clases de equivalen- 


cia corresponden a las clases de paralelismo de vectores (las 
rectas agujeradas por el origen). Llamaremos haz de rec- 
tas paralelas a una clase de paralelismo de rectas, es decir, 
al conjunto de todas las rectas paralelas a una dada (to- 
das paralelas entre sí). Hay tantos haces de rectas paralelas 
como hay rectas por el origen, pues cada haz contiene exac- 


tamente una de estas rectas que, quitándole el origen, está 
formada por los posibles vectores direccionales para las rec- 
tas del haz. 


Además, nuestra nueva noción de paralelismo tiene la gran ventaja de que se ex- 
tiende a cualquier espacio vectorial. Nótese primero que la noción de paralelismo entre 
vectores no nulos se extiende sin problema a ¡R3, pues está en términos del producto 
por escalares; y luego nuestra noción de paralelismo entre rectas se sigue de la de sus 
vectores direccionales. Por ejemplo, en el espacio I¡R* corresponde a nuestra noción 
intuitiva de paralelismo que no es conjuntista. Dos rectas pueden no intersectarse sin 
tener la misma dirección. 


EJERCICIO 1.44 Dala descripción paramétrica de dos rectas en R3 que no se inter- 
secten y que no sean paralelas. 


EJERCICIO 1.45 (Quinto D3) Demuestra que dados un plano TT en R$ y un punto q 
fuera de él, existe un plano TT” que pasa por q y que no intersecta a TT. 
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1.6 Intersección de rectas l 


En esta sección se analiza el problema de encontrar la intersección de dos rectas. 
De nuevo, sabemos por experiencia e intuición que dos rectas no paralelas se deben 
intersectar en un punto. Cómo encontrar ese punto es la pregunta que responderemos 
en esta sección. 


Hagamos un ejemplo. Sean 


li; = ((0,1)+t(1,2)|tc R) 
l, = 1(3,4)+s(2,1)|s € R). 


con las dos descripciones. Es decir, buscamos una t € 
s ER que satisfagan 


(0,1) +t(1,2) = (3,4) +s(2, 1), 


La intersección de estas dos rectas £; ML, es el punto que cumple 


R y una 


donde es importante haber dado a los dos parámetros diferente 


nombre. Esta ecuación vectorial puede reescribirse como 


t(1,2) —s(2,1) (3,4) — (0,1) 
(t-25,2t—s) = (3,3), 


que nos da una ecuación lineal con dos incógnitas en cada coordenada. Es decir, 


debemos resolver el sistema: 


t-2s = 3 
2t=s = 3. 


Si despejamos t en la primera ecuación, se obtiene t =3+2s. Y al sustituir en la 


segunda obtenemos la ecuación lineal en la variable s: 
2(3+2s) —s=3, 
que se puede resolver directamente: 


6+4s=s = 3 
3s = —3 
$ = =l 


Y por lo tanto, al sustituir este valor de s en la descripción de f,, el punto 


(3,4) — (2,1) = (1,3) 
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está en las dos rectas. Nótese que bastó con encontrar el valor de un solo parámetro, 
pues de la correspondiente descripción paramétrica se obtiene el punto deseado. Pero 
debemos encontrar el mismo punto si resolvemos primero el otro parámetro. Veá- 
moslo. Otra manera de resolver el sistema es eliminar la variable s. Para esto nos 
conviene multiplicar por —2 la segunda ecuación y sumarla a la primera, para obtener 


=3t = —3, 
de donde t = 1. Al sustituir en la parametrización de l,, nos da: 
(0, 1) + (1,2) = (1,3), 


como esperábamos. 

Observemos primero que hay muchas maneras de resolver un sistema de dos ecua- 
ciones lineales (se llaman así porque los exponentes de las incógnitas son uno —parece 
que no hay exponentes—) con dos incógnitas. Cualquiera de ellos es bueno y debe 
llevar a la misma solución. 

Que en este problema particular aparezca un sistema de ecuaciones no es casual- 
idad, pues en general encontrar la intersección de rectas se tiene que resolver así. Ya 
que si tenemos dos rectas cualesquiera en R?: 


l, = lp +tvl|te R) 
lo = [q +sul|seR). 


Su intersección está dada por la t y la s que cumplen 
p+tv=qw+su, 


que equivale a 
tv-su=q-p. (1.3) 


Esta ecuación vectorial, a su vez, equivale a una ecuación lineal en cada coordenada. 
Como estamos en IR?, y p, q, v y u son constantes, nos da entonces un sistema de dos 
ecuaciones lineales con las dos incógnitas t y s. En cada caso particular el sistema 
se puede resolver de diferentes maneras; por ejemplo, despejando una incógnita y 
sustituyendo, o bien tomando múltiplos de las ecuaciones y sumándolas para eliminar 
una variable y obtener una ecuación lineal con una sola variable (la otra) que se 
resuelve directamente. 

Para hacer la teoría y entender qué pasa con estos sistemas en general, será bueno 
estudiar las ecuaciones lineales con dos incógnitas de manera geométrica; veremos que 
también están asociadas a las líneas rectas. Por el momento, de manera “algebraica”, 
o mejor dicho, mecánica, resolvamos algunos ejemplos. 


EJERCICIO 1.46 Encuentra los seis puntos de intersección de las cuatro rectas del 
Ejercicio 1.20. 
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EJERCICIO 1.47 Encuentra las intersecciones de las rectas l¡ =((2,0) +t(1,-—2)|t € 
RJ L =((2,1) +s(-2,4) |s €R) y l3 =((1,2) + 1(3,-6) | r € R]). Dibújalas para entender 
qué está pasando. 


1.6.1 Sistemas de ecuaciones lineales I 


Veamos ahora un método general para resolver sistemas. 


Lema 1.9 £l sistema de ecuaciones 


as+bt=e 


es+dt=f a 


en las dos incógnitas s, t tiene solución única si su determinante ad — bc es distinto 
de cero. 


Demostración. Hay que intentar resolver el sistema general, seguir un método que 
funcione en todos los casos independientemente de los valores concretos que puedan 
tener las constantes a, b, c, d, e y f. Y el método más general es el de “eliminar” 
una variable para despejar la otra. 

Para eliminar la t del sistema (1.4), multiplicamos por d la primera ecuación, y 
por —b la segunda, para obtener 


ads+bdt = ed (1.5) 
—bcs —bdt = —bf, 
de tal manera que al sumar estas dos ecuaciones se tiene 
(ad —bc)s =ed— bf. (1.6) 
Si ad — bc 4 0 ,* entonces se puede despejar s: 


e ed — bf 


ade be 


Y análogamente (¡hágalo como ejercicio!), o bien, sustituyendo el valor de s en 
cualquiera de las ecuaciones originales (¡convénzase!), se obtiene t: 

af —ec 

ad—bc' 
Lo cual demuestra que si el determinante es distinto de cero, la solución es única; es 
precisamente la de las dos fórmulas anteriores. Ol 


3 A] número ad — bc se le llama el determinante del sistema, porque determina que en este punto 
podemos proseguir. 
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Veamos ahora qué pasa con el sistema (1.4) cuando su determinante es cero. Si 
ad — bc = 0, obsérvese que aunque la ecuación (1.6) parezca muy sofisticada porque 
tiene muchas letras, en realidad es o una contradicción (algo falso) o una trivialidad. 
El coeficiente de s es 0, así que el lado izquierdo es 0. Entonces, si el lado derecho no 
es O es una contradicción; y si sí es 0, es cierto para cualquier s y hay una infinidad 
(precisamente un R) de soluciones. 

Lo que sucedió en este caso (ad — bc = 0) es que al intentar eliminar una de 
las variables también se eliminó la otra (como debió haberle sucedido al estudiante 
que hizo el Ejercicio 1.47). Entonces, o las dos ecuaciones son múltiplos y comparten 
soluciones (cuando ed = bf las ecuaciones (1.5) ya son una la negativa de la otra); o 
bien, sólo los lados izquierdos son múltiplos, pero los derechos no lo son por el mismo 
factor (ed 4 bf) y no hay soluciones comunes. 

Podemos resumir esto con el siguiente teorema que ya hemos demostrado. 


Teorema 1.10 Un sistema de dos ecuaciones lineales 


as+bt=e 


es+dt=f id 


en las dos incógnitas s, t tiene solución única si y sólo si su determinante ad — be 
es distinto de cero. Además, si su determinante es cero (si ad—bc = 0) entonces no 
tiene solución o tiene una infinidad de ellas (tantas como R). 


Si recordamos que los sistemas de dos ecuaciones lineales con dos incógnitas 
aparecieron al buscar la intersección de dos rectas, este teorema corresponde a nuestra 
intuición de las rectas: dos rectas se intersectan en un solo punto o no se intersectan 
o son la misma. De él dependerá la demostración de la mitad del Quinto que tenemos 
pendiente, pero conviene entrarle al toro por los cuernos: estudiar y entender primero 
el significado geométrico de las ecuaciones lineales con dos incógnitas. 


EJERCICIO 1.48 Para las rectas de los dos ejercicios anteriores (1.46, 1.47), determina 
cómo se intersectan las rectas, usando únicamente el determinante. 


1.7 Producto interior 


En esta sección se introduce un ingrediente central para el estudio moderno de la 
geometría euclidiana: el “producto interior”. Además de darnos la herramienta al- 
gebraica para el estudio geométrico de las ecuaciones lineales, en la sección siguiente 
nos dará mucho más. De él derivaremos después las nociones básicas de distancia y 
ángulo (de rigidez). Puede decirse que el producto interior es, aunque menos intuitivo, 
más elemental que las nociones de distancia y ángulo pues éstas se definirán en base a 
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aquél (aunque se verá también que estas dos juntas lo definen). El producto interior 
depende tan íntimamente de la idea cartesiana de coordenadas, que no tiene ningún 
análogo en la geometría griega. Pero tampoco viene de los primeros pininos que hizo 
la geometría analítica, pues no es sino hasta el siglo XIX cuando se le empezó a dar 
la importancia debida al desarrollarse las ideas involucradas en la noción general de 
espacio vectorial. Podría entonces decirse que el uso del producto interior (junto con 
el lenguaje de espacio vectorial) marca dos épocas en la geometría analítica. Pero es 
quizá la simpleza de su definición su mejor tarjeta de presentación. 

Definición 1.7.1 Dados dos vectores u = (u;,,u>») y v= (v¡,v>), su producto interno 
(también conocido como producto escalar —que preferimos no usar para no confundir 
con la multiplicación por escalares— o bien como producto punto) es el número real: 


u-v= (u, uz) - (v;, vz) := Uv] + U2v2. 


En general, en R” se define el producto interior (o el producto punto) de dos vectores 
u= (u;,.. Un) y V= (vy,..., Vn) como la suma de los productos de sus coordenadas 
correspondientes, es decir, 


n 
UV := UV] + +++ Un Vo = ) Uuvi. 


i=1 
Así, por ejemplo: 


(43)-2,=1)=4x2+3% (2)=8=3=5, 
1231856) == 4160=18=-=4, 


Obsérvese que el producto interior tiene como ingredientes dos vectores (u, v € 
R”) y nos da un escalar (u - v € R); no debe confundirse con la multiplicación escalar, 
que de un escalar y un vector nos da un vector, excepto en el caso n = 1, en el que 
ambos coinciden con la multiplicación de los reales. 

Antes de demostrar las propiedades básicas del producto interior, observemos 
que nos será muy útil para el problema que dejamos pendiente sobre sistemas de 
ecuaciones. En efecto en una ecuación lineal con dos incógnitas, x y y digamos, 
aparece una expresión de la forma ax + by con a y b constantes. Si tomamos un 
vector constante u = (a,b) y un vector variable x = (x, y), ahora podemos escribir 


uU-Xx=ax-+ by 


y el “paquete básico” de información está en u. En particular, como la mayoría de 
los lectores ya deben saber, la ecuación lineal 


ax + by =c 


donde c es una nueva constante, define una recta. Con el producto interior esta 
ecuación se reescribe como 
U-x=cC: 
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Veremos cómo en el vector u y en la constante c se almacena la información geométrica 
de esa recta. Pero no nos apresuremos. 

Como en el caso de la suma vectorial y la multiplicación por escalares, conviene 
demostrar primero las propiedades elementales del producto interior para manejarlo 
después con más soltura. 


Teorema 1.11 Para todos los vectores U, VW, WE R"”, y para todo número t E R se 
cumple que 


¿) u.v=v-u 

1) u- (tv) =t(u-v) 

114) u-(v+w)=u-.v+u-w 
iv) u-u>0 


v) u.u=05u=0 


Demostración. Nos interesa demostrarlo en R? (y como ejercicio en R*), aunque 
el caso general es esencialmente lo mismo. Convendrá usar la notación de la misma 
letra con subíndices para las coordenadas, es decir, tomar u = (u¡, uz), v= (v;, vz) 
y w = (w;,,w>). El enunciado (i) se sigue inmediatamente de las definiciones y la 
conmutatividad de los números reales; (ii) se obtiene al factorizar: 


u - (tv) = u (tv) + uz (tv,) = t(uv; + u2v2) =t(u - v). 


De la distributividad y conmutatividad en los reales se obtiene (111): 


u-(v+w) = u(v +w,) + u2z(v, + w,) 
= UV] + UyWj; + UV) + UW) 


= (uv + uv) + (uw + Uw) =u-v+u-w. 
Al tomar el producto interior de un vector consigo mismo se obtiene 
u-u=ul+u, 


que es una suma de cuadrados. Como cada cuadrado es positivo la suma también lo 
es (iv); y si fuera O significa que cada sumando es 0, es decir, que cada coordenada 


es 0 (v). O 


EJERCICIO 1.49 Demuestra el Teorema 1.11 para n = 3. 
EJERCICIO 1.50 Calcula el producto interior de algunos vectores del Ejercicio 1.3. 
EJERCICIO 1.51 Demuestra sin usar (v), sólo la definición de producto interior, que 
dado u € R? se tiene 

u-x=0, VxeRlSu=0. 
(Observa que sólo hay que usar el lado izquierdo para dos vectores muy sencillos.) 
EJERCICIO 1.52 Demuestra el análogo del ejercicio anterior en R3. ¿Y en R”? 
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1.7.1 El compadre ortogonal 


El primer uso geométrico que daremos al producto interior será para detectar la 
perpendicularidad. Es otra de las nociones básicas en los axiomas de Euclides que 
incluyen el concepto de ángulo recto. 
Fijemos el vector u € R?, y para simplificar la notación digamos que u = (a,b) 4 
O. Si tomamos x = (x,y) como un vector variable, vamos a ver que las soluciones de 
la ecuación 
u»*=0, (1.8) 


es decir, los puntos en R? cuyas coordenadas (x, y) satisfacen la ecuación 
ax + by =0, 


forman una recta que es perpendicular a u. Para esto consideraremos una solución 
particular (una de las más sencillas), x = —b , y = a; y será tan importante esta 
solución que le daremos nombre: 


Definición 1.7.2 El compadre ortogonal del vector u = (a,b), denotado u- y que 
se lee “u—perpendicular” o “u—ortogonal”, es 


ul = (—b,a). 


(Se intercambian coordenadas y a la primera se le cambia el signo.) 


Se cumple que 


u-ul =a(—b)+ba=0; 


y para justificar el nombre hay que mostrar que u*+ 
se obtiene de u al girarlo 90” en sentido contrario a 
las manecillas del reloj (alrededor del origen). Para 
ver esto considérese la figura al margen, donde su- 
ponemos que el vector u = (a,b) está en el primer 
cuadrante, es decir, que a > 0 y b > 0. Al rotar el 
triángulo rectángulo de catetos a y b (e hipotenusa 
u) un ángulo de 90” en el origen se obtiene el corre- 
spondiente a u?. Se incluyen además las siguientes 
dos rotaciones para que quede claro que esto no de- 
pende de los signos de a y b. 

Podemos concluir entonces que el “compadre or- 
togonal”, pensado como la función de IR? en R? que 
manda al vector u en su perpendicular u* (u => 
ul“), es la rotación de 90 en sentido contrario a las 
manecillas del reloj alrededor del origen. Es fácil comprobar que (u+)+ = —u, ya sea 
con la fórmula o porque la rotación de 180? (rotar y volver a rotar 90%) corresponde 
justo a tomar el inverso aditivo. 
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Como ya es costumbre, veamos algunas propiedades bonitas de la función “com- 
padre ortogonal” respecto de las otras operaciones que hemos definido. La demostra- 
ción, que consiste en dar coordenadas y aplicar definiciones, se deja al lector. 


Lema 1.12 Para todos los vectores u, v € R?, y para todo número t € R se cumple 
que 


¿) (u+v) =u-+v! 
ti) (tu)? =t (u+ 
ii) ul .vi =u-v 

iv) ul .v=-(u-.vi). 


— 


EJERCICIO 1.53 Demuestra el lema anterior. 


Sistemas de ecuaciones lineales II 


Usemos la herramienta del producto interior y el compadre ortogonal para revisar 
nuestro trabajo previo (sección 1.6.1) sobre sistemas de dos ecuaciones lineales con 
dos incógnitas. Si pensamos cada ecuación como la coordenada de un vector (y así 
fue como surgieron), un sistema tal se escribe 


su+tv=C, (1.9) 


donde s y t son las incógnitas y u, v, € € R? están dados. Para que este sistema sea 
justo el que ya estudiamos, (1.4), denotemos las coordenadas u = (a,c), v= (b, d); 
y para las constantes (con acrónimo €), digamos que e = (e,f). Como ésta es 
una ecuación vectorial, si la multiplicamos (con el producto interior) por un vector, 
obtendremos una ecuación lineal real. Y para eliminar una variable, digamos s, 
podemos multiplicar por el compadre ortogonal de u, para obtener 


ul -(su)+u*-. (tv) = ul-e 
s (u--u)+t (uv) = ue 
s(0)+t(u“-v) = u*-c 

ti y == E 


Definición 1.7.3 El determinante de los vectores u, v € R? es el número real 
det (u, v) :=u*-.v. 


Así que si suponemos que det (u, v) 4 0, podemos despejar t. De manera análoga 
y) y 
podemos despejar s, y entonces concluir que el sistema de ecuaciones tiene solución 
única: 
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que es justo el Lema 1.9. 


EJERCICIO 1.54 Escribe en coordenadas (u = (a, c), v= (b, d)) cada uno de los pasos 
anteriores para ver que corresponden al método clásico de eliminación. (Quizá te convenga 
escribir las parejas como columnas, en vez de renglones, para que el sistema de ecuaciones 
sea claro.) 


La ecuación lineal homogénea 


Ahora sí, describamos el conjunto de soluciones de la ecuación lineal homogénea: 


u-.x=0. 
u 
L Proposicion 1.13 Sea u € R? —(0), entonces 
ÍxeR?*]u-x=0)=£uys, 
0 


donde, recuérdese, Ly. = [tul |t e Rj. 


Demostración. Tenemos que demostrar la igualdad de dos conjuntos. Esto se hace 
en dos pasos que corresponden a ver que cada elemento de un conjunto está también 
en el otro. 

La contención más fácil es “D”. Un elemento de £,. es de la forma tu” para 
algún t € I¡R. Tenemos que demostrar que tu” está en el conjunto de la izquierda. 
Para esto hay que ver que satisface la condición de pertenencia, que se sigue de (ii) 
en el Lema 1.12, y (ii) en el Teorema 1.11: 


u- (tus) =u-t (ue) =t (u-u*) =0. 


Para la otra contención, tomamos x € R? tal que u -x = 0 y debemos encontrar 
tE R tal que x =tu". Sean a, b € R las coordenadas de u, es decir u = (a,b) y 
análogamente, sea x = (x, y). Entonces estamos suponiendo que 


ax + by =0. 


Puesto que u % O por hipótesis, tenemos que a 400 b 4 0; y en cada caso podemos 
despejar una variable para encontrar el factor deseado: 


y por lo tanto 
x= (4) =2(-b,0)=(2)u*; 
a a 
o bien, 


AOS Y == (x,4) = (—b, a) = (5) ue. 
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Hemos demostrado que la ecuación lineal homogénea (se llama así porque la con- 
stante es 0) ax+by = 0, con a y b constantes reales, tiene como soluciones las parejas 
(x, y) que forman una recta por el origen de R?. Si empaquetamos la información de 
la ecuación en el vector u = (a, b), tenemos que u % O, pues de lo contrario no habría 
tal ecuación lineal (sería la tautología 0 = 0 de lo que estamos hablando, y no es así). 
Pero además hemos visto que el vector u es ortogonal (tambien llamado normal) a 
la recta en cuestión, pues ésta está generada por el compadre ortogonal u”. 

Se justifica entonces la siguiente definición, que era nuestro primer objetivo con el 
producto interior (donde, de una vez, estamos extrapolando a todas las dimensiones). 


Definición 1.7.4 Se dice que dos vectores u y v en R” son perpendiculares u orto- 
gonales, y se escribe u | v, siu-.v=0. 


Podemos reformular entonces la proposición anterior como “dada u € R?, u 4 0, 
el conjunto de x € R? que satisfacen la ecuación u - x = 0 son la recta perpendicular 
au”. 

Antes de estudiar la ecuación general (no necesariamente homogénea), notemos 
que si el producto interior detecta perpendicularidad, también se puede usar, junto 
con el compadre ortogonal, para detectar paralelismo en el plano. 


Corolario 1.14 Sean u y v dos vectores no nulos en R?, entonces 


ulv +  det(uv) =u*.v=0. 
Demostración. Por la Proposición 1.13, u* . v=0 si y sólo si v pertenece a la recta 


generada por (u-)”, que es la recta generada por u pues (u-)” = -u. Ol 


Hay que hacer notar que si les damos coordenadas a u y a v, digamos u = (a, b) 
y v= (c,d), entonces el determinante, que detecta paralelismo, es 


ul .v=ad—bc, 


que ya habíamos encontrado como determinante del sistema de ecuaciones (1.9), pero 
considerando u = (a,c) y v= (b, d). 


EJERCICIO 1.55 Dibuja la recta definida como (x € R? | u-x = 0) para u con cada 
uno de los siguientes vectores: a) (1,0), b) (0,1), e) (2,1), d) (1,2), e) (-1, 1). 
EJERCICIO 1.56 Describe el lugar geométrico definido como [x € R3 | u-x = 0) para 
u con cada uno de los siguientes vectores: a) (1,0,0), b) (0,1,0), e) (0,0,1), d) (1,1,0). 
EJERCICIO 1.57 Sean u = (a,b) y v = (c,d) dos vectores no nulos. Sin usar el 
producto interior ni el compadre ortogonal —es decir, de la pura definición y con “álgebra 
elemental” — demuestra que u es paralelo a v si y sólo si ad — bc = 0. Compara con la 
última parte de la demostración de la Proposición 1.13. 
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1.8 La ecuación normal de la recta 


Demostraremos ahora que todas las rectas de R? se pueden describir con una ecuación 


U-x=GC, 


donde u € R? es un vector normal a la recta y la constante c € R es escogida 
apropiadamente. Esta ecuación, vista en coordenadas, equivale a una ecuación lineal 
en dos variables (ax + by = c, al tomar u = (a, b) constante y x = (x, y) es el vector 
variable). Históricamente, el hecho de que las rectas tuvieran tal descripción fue una 
gran motivación en el inicio de la geometría analítica. 

Tomemos una recta con dirección d 40 


ler l=1p+td|teR). 
0 Si definimos u := d* y c := u-p, afirmamos, es decir, demostraremos, 
d que 
l=fxEeR?*]u-.x=c). 
Xx 
y Llamemos / a este último conjunto; demostrar la igualdad l = 


(!, equivale al demostrar las dos contenciones l C (' SU CL 
Six =p+tdE€l, entonces (usando las propiedades del producto interior y del 
compadre ortogonal) tenemos 


u.x = u-(p+td) =u-p+t(u- d) 
= u-p+t(d*-d)=u-p+0=c, 


lo cual demuestra que £ C (. Por el otro lado, dado x € (' (i.e., tal que u-x =C), 
sea y := Xx — p (obsérvese que entonces x = p + y). Se tiene que 


u-y =u-(x-p)=u-x-—-u:p=c-c=0, 


Por la Proposición 1.13, esto implica que y es paralelo a u* = —d ; y por tanto que 
x=p+uy€?l. Esto demuestra que l = fl. 

En resumen, hemos demostrado que toda recta puede ser descrita por una ecuación 
normal: 


Teorema 1.15 Sea l =[p+td|t ER) una recta en R?. Entonces l consta de los 
vectores x € R? que cumplen la ecuación U -Xx =C, que escribimos 


Ll: u-x=C, 
donde u=d* yc=u-p. O 


Este teorema también podría escribirse: 
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Teorema 1.16 Sea d € R?—(0) , entonces 
[p+td|teR)=[xER?*|d*.-x=d' -p) 


Estos enunciados nos dicen cómo encontrar una ecuación normal para una recta 
descrita paramétricamente. Por ejemplo, la recta 


[(s —2,3—2s)|s € R) 
tiene como vector direccional al (1, —2). Por tanto tiene vector normal a su compadre 


ortogonal (2,1), y como pasa por el punto (—2, 3) entonces está determinada por la 
ecuación 


(2, 1) 4 (x, y) A (2, 1) á (=2 50) 
Z2x+y = -—1 


(sustituya el lector las coordenadas de la descripción paramétrica en esta última 
ecuación). 

Para encontrar una representación paramétrica de la recta l dada por una ecuación 
normal 

A Y 

(léase “Ll dada por la ecuación u - x = Cc”), bastará con encontrar una solución par- 
ticular p (que es muy fácil porque se puede dar un valor arbitrario a una variable, 
0 es la más conveniente, y despejar la otra), pues sabemos que la dirección es u* (o 
cualquier paralelo). Por ejemplo, la recta dada por la ecuación normal 


2x-3y =2 
tiene vector normal (2,—3). Por tanto tiene vector direccional (3,2); y como pasa 
por el punto (1,0), es el conjunto 
[(1+3t,2t) |t € R). 


Esto también se puede obtener directamente de las coordenadas, pero hay que 
partirlo en casos. Si u = (a, b), tenemos 


> ¡6 by =C: 
Supongamos que a % 0. Entonces se puede despejar x: 
c b 
x==-=-Y 
a a 
y todas las soluciones de la ecuación se obtienen dando diferentes valores a y; es decir, 


son ((G—qu) lu er) =( (20) +u (71) tve p. 


que es una recta con dirección (—b, a). Nos falta ver qué pasa cuando a = 0, pero 
entonces la recta es la horizontal y = c/b. Si hubieramos hecho el análisis cuando 
b 4 0, se nos hubiera confundido la notación del caso clásico que vemos en el siguiente 
párrafo. 


A 


...Dibujo 
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La ecuación “funcional” de la recta 


Es bien conocida la ecuación funcional de la recta 


y = mx-+b, 


que se usa para describir rectas como gráficas de una fun- 
ción; aquí m es la pendiente y b es la llamada “ordenada 
al origen” o el “valor inicial”. En nuestros términos, esta 


ecuación se puede reescribir como 
=mx+uy =b 


o bien, como 


(—m, 1) i (x, y) =b. 


Por lo tanto, tiene vector normal n = (—m, 1). Podemos escoger a d = (1,m) =—n 


E 


como su vector direccional y a p = (0, b) como una solución particular. Así que su 
parametrización natural es (usando a x como parámetro): 


[(0,b) +x(1,m)|x € 


R=((x,mx+b)|x€R), 


que es la gráfica de una función. Obsérvese que todas las rectas excepto las verticales 
(con dirección (0, 1)) se pueden expresar así. 

No está de más observar que para cualquier función f : R => 
subconjunto de R?, llamado la gráfica de la función f definida paramétricamente 


como 


[(x, F(x 


R se obtiene un 


)) [Ixe Ry; 


y entonces hemos visto que todas las rectas, excepto las verticales, son la gráfica de 
funciones de la forma f(x) = mx-+b, que en el capítulo 3 llamaremos funciones afines. 


EJERCICIO 1.58 Para las siguientes rectas, encuentra una ecuación normal y, en su 


caso, su ecuación funcional: 
a) ((2,3+t(1,1)|teR) 


( 
b) (1,0 +s(2,1)|s€R) 
c) [(0,-2) + (—r,2r)|r e Rj 
d) ([(1,3)+s(2,0)|s €R)] 


e) [(t-1,-2t) |teR) 


EJERCICIO 1.59 —Da una descripción paramétrica de las rectas dadas por las ecua- 


ciones: 

a) 2x-3y=1 
b) 2x-=y=2 
c) 2y-4x=2 
d) x+5y=-1 


) 3-4y=2x+2 


O 
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EJERCICIO 1.60 Encuentra una ecuación normal para la recta que pasa por los puntos: 
a) (2,1) y (3,4) 

a 

e) 1337131) 

d) (2,0) y (1,1) 

EJERCICIO 1.61 Sean p y q dos puntos distintos en R?. Demuestra que la recta l que 
pasa por ellos tiene ecuación normal: 


lt: (q-p)-x=q-p. 


EJERCICIO 1.62 Encuentra la intersección de las rectas (a) y (b) del Ejercicio 1.59. 


EJERCICIO 1.63 Encuentra la intersección de la recta (a) del Ejercicio 1.58 con la de 
la recta (a) del Ejercicio 1.59, donde a € [a,b,c,d) . 


EJERCICIO 1.64 Dibuja las gráficas de las funciones f(x) =x? y g(x) =x?. 


1.8.1 Intersección de rectas II 


Regresemos ahora al problema teórico de encontrar la intersección de rectas, pero con 
la nueva herramienta de la ecuación normal. Consideremos dos rectas l; y l, en R?. 
Sean u = (a,b) y v= (c, d) vectores normales a ellas respectivamente, de tal manera 
que ambos son no nulos y existen constantes e, f € R para las cuales 


LE u-.x=e 
la e 


Es claro entonces que l Ml consta de los puntos x € IR? que satisfacen ambas 
ecuaciones. Si llamamos, como de costumbre, x y y a las coordenadas de x (es decir, 
si hacemos x = (x, y)), las dos ecuaciones anteriores son el sistema 


ax + by 


ex du. = T, 


con a,b,c,d,e,f constantes y x, y variables o incógnitas. Éste es precisamente el 
sistema que estudiamos en la sección 1.6.1; aunque allá hablabamos de los “paráme- 
tros s y t”, son esencialmente lo mismo. Pero ahora tiene el significado geométrico 
que buscábamos: resolverlo es encontrar el punto de intersección de dos rectas (sus 
coordenadas tal cual, y no los parámetros para encontrarlo, como antes). Como 
ya hicimos el trabajo abstracto de resolver el sistema, sólo nos queda por hacer la 
traducción al lenguaje geométrico. Como ya vimos, el tipo de solución (una única, 
ninguna o tantas como reales) depende del determinante del sistema ad—bc, y éste, a 
su vez, ya se nos apareció (nótese que det (u,v) = u* .v = ad—bc) como el “numero 
mágico” que detecta paralelismo (Corolario 1.14). De tal manera que del Corolario 
1.14 y del Teorema 1.10 podemos concluir: 
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Teorema 1.17 Dadas las rectas 


Li 3 u-x=e 
la 3 Vir=?1T, 


entonces: 


¿) det(u,v) 40 S (NL, es un único punto; 
11) det (u,v)=0 > /; [ LE tl; nl =0 ol, =fl,. 


Consideremos con más detenimiento el segundo caso, cuando el determinante u”-v 
es cero y por tanto los vectores normales (y las rectas) son paralelos. Tenemos entonces 
que para alguna t € R, se cumple que v = tu (nótese que t % 0, pues ambos 
vectores son no nulos). La disyuntiva de si las rectas no se intersectan o son iguales 
corresponde a que las constantes e y f difieran por el mismo factor, es decir si f 4 te 
o f = te respectivamente. Podemos sacar dos conclusiones interesantes. Primero, 
dos ecuaciones normales definen la misma recta si y sólo si las tres constantes que 
las determinan (en nuestro caso (a, b,e) y (c, d, f)) son vectores paralelos en R*. Y 
segundo, que al fijar un vector u = (a, b) y variar un parámetro c € R, las ecuaciones 
u -x =C determinan el haz de rectas paralelas que es ortogonal a u. 

Otro punto interesante que vale la pena discutir es el método que usamos para 
resolver sistemas de ecuaciones. Se consideraron ciertos múltiplos de ellas y luego se 
sumaron. Es decir, para ciertas x y (3 en R se obtiene, de 
las dos ecuaciones dadas, una nueva de la forma 


-qQu+Pv 
(au+fv).x=ae+pf. 


Ésta es la ecuación de otra recta. La propiedad importante 
que cumple es que si p satisface las dos ecuaciones dadas, 
entonces también satisface esta última por las propiedades 
de nuestras operaciones. De tal manera que esta nueva, 
ecuación define una recta que pasa por el punto de inter- 
sección p. El método de eliminar una variable consiste en 
encontrar la horizontal o la vertical que pasa por el punto 
(la mitad del problema). Pero en general, todas las ecuaciones posibles de la forma 
anterior definen el haz de rectas concurrentes por el punto de intersección p cuando 
u y v no son paralelos, pues los vectores au + Bv (al variar x y $) son más que 
suficientes para definir todas las posibles direcciones. 

Por último, y aunque ya hayamos demostrado la parte de existencia, concluyamos 
con el Quinto usando al Teorema 1.17. 


Teorema 1.18 Dada una recta l y un punto p fuera de ella en el plano, existe una 
única recta l! que pasa por p y no intersecta a l. 
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Demostración. Existe un vector u % O y una constante c € IR, tales que l está dada 
por la ecuación U - Xx =C. Sea 


Entonces p € l' porque satisface la ecuación, LN =() porque u-p % c (pues p EL), 
y cualquier otra recta que pasa por p intersecta a l pues su vector normal no es 
paralelo a u. O 


EJERCICIO 1.65 Encuentra la intersección de las rectas (a), (b), (c) y (d) del Ejercicio 
1.59. 

EJERCICIO 1.66 Demuestra que dos vectores u y v en R? son linealmente indepen- 
dientes si y solo si u* .v 4 0. 


EJERCICIO 1.67 Demuestra que dos vectores u y v en ¡R? son linealmente indepen- 
dientes si y sólo si R? = (u, v). 

EJERCICIO 1.68 A cada terna de números reales (a, b,c), asóciale la ecuación ax + 
by=cC. 

i) ¿Cuáles son las ternas (como puntos en R3) a las que se le asocian rectas en R? por su 
ecuación normal? 

1i) Dada una recta en R?, describe las ternas (como subconjunto de R3) que se asocian a 
ella. 

iii) Dado un haz de rectas paralelas en R?, describe las ternas (como subconjunto de R*) 
que se asocian a rectas de ese haz. 

iv) Dado un haz de rectas concurrentes en R?, describe las ternas (como subconjunto de 
R3) que se asocian a las rectas de ese haz. 


1.8.2 Teoremas de concurrencia 


En esta sección, aplicamos la ecuación normal de las rectas 
para demostrar uno de los teoremas clásicos de concurrencia, 
de líneas y dejamos el otro como ejercicio. 

La altura de un triángulo es la recta que pasa por uno de 
sus vértices y es ortogonal al lado opuesto. 


Teorema 1.19 Las alturas de un triángulo son concurrentes. 


Demostración. Dado un triángulo con vértices a, b, Cc, tenemos que la altura por 
el vértice a, llamémosla n, (“eta-sub-a”), está definida por 


Na: [e—-b).-x=(c—-b)-a, 


42 CAPÍTULO 1. EL PLANO EUCLIDIANO 


pues es ortogonal al lado que pasa por b y c, que tiene dirección (c — b), y pasa por 
el punto a. Analogamente: 


Mec (a—c)-x=(a—c)-b 
Mi % (b-a)-x=(b-a).c. 


Obsérvese ahora que la suma (lado a lado) de dos de estas ecuaciones da precisa- 
mente el negativo de la tercera. Por ejemplo, sumando las dos primeras obtenemos 


(c—-b).x+(a—c).x = (c-b).a+(a—c)-b 
(c-b+a—-c)x = c-a-b.a+a-b—c-b 
(a—-b).x = (a—b)-.c<c. 


Así que si X € N¿ N Tp, entonces cumple las dos primeras ecuaciones y por tanto 
cumple su suma que es “menos” la ecuación de n., y entonces x € n.. Así que las 
tres rectas pasan por el mismo punto. Ol 


EJERCICIO 1.69 Demuestra que las tres mediatrices de un triángulo son concurrentes 
(el punto en el que concurren se llama circuncentro). Donde la mediatriz de un segmento 
es su ortogonal que pasa por el punto medio. 

EJERCICIO 1.70 Encuentra el circuncentro del triángulo con vértices (1,1), (1, —1) y 
(—2,—2). Haz el dibujo del triángulo y sus mediatrices. 


1.8.3 Planos en el espacio II 


Hemos definido las rectas en RR” por su representación paramétrica y, en R?, acabamos 
de ver que también tienen una representación normal (con base en una ecuación li- 
neal). Es entonces importante hacer notar que este fenómeno sólo se da en dimensión 
2. En R?, que es el otro espacio que nos interesa, los planos (¡no las rectas!) son las 
que se definen por la ecuación normal. Veamos esto con cuidado. 
Dado un vector n € R* distinto de O; sea, para cualquier d € R, 


Ma: n.x=d 


es decir, Ma := [x € R? | n-.x = d). Llamamos a la constante d pues ahora el 
vector normal es de la forma n = (a,b,c) y entonces la ecuación anterior se escribe 
en coordenadas como 


ax+by+cez=d 


con el vector variable x = (x,y,Zz). Afirmamos que IT, es un plano. Recuérdese que 
definimos plano como el conjunto de combinaciones afines (o baricéntricas) de tres 
puntos no colineales. 
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Veamos primero que si tres puntos a, b, c satisfacen la ecuación n - x = d, 
entonces los puntos del plano que generan también la satisfacen. Para esto, tomamos 
a, Pp, y E R tales que x+ PB + y = 1, y entonces se 

tiene 


n-(aa+ fb+ye) = a(n-a+8(n-b)+y(n.c) 
ad+ d+ yd 
= (a+ B+y) d=d. 


Esto demuestra que si a, b, e € TT¿ entonces el plano 
(o si son colineales, la recta) que generan está con- 
tenido en TT¿. Faltaría ver que en Ty hay tres puntos 
no colineales y luego demostrar que no hay más solu- 
ciones que las del plano que generan. 
Pero mejor veámoslo desde otro punto de vista: el lineal en vez del baricéntrico. 
Afirmamos que los conjuntos IT¿, al variar d, son la familia de planos normales a 
n. Para demostrar esto, hay que ver que Tly es un plano 
n por el origen y que IT¿ es un trasladado de To, es decir, To 
empujado por algún vector constante. 
Esto último ya se hizo en esencia cuando vimos el caso de 
rectas en el plano, así que lo veremos primero para remarcar 
lo general de aquella demostración. Supongamos que p € R* 
es tal que 


n:.p= d, 
es decir, que es una solución particular. Vamos a demostrar que 
Ma =Tlo +p:=[(y +p|y € To); (1.10) 


es decir, que si x € Ig entonces x = y + Pp para algún y € Ilo; y al revés, que si 
y € To entonces x= y +Pp € Ta. 
Dado x € Ta (i.e., tal que n -x = d), sea y :=x— p. Como 


n-y=n-(x-p)=n.x—n-p=d-d=0, 


entonces y € Ilo y es, por definición, tal que x = 
y + p; por lo tanto Ilj C Mo +p. Y al revés, si 
y € Mo y x= y + P, entonces 


n.-x=n-(y+p)=n:y+n-p=0+d=d 


y por lo tanto x € Ta. Hemos demostrado (1.10). 

Nos falta ver que Tly es efectivamente un plano d 
por el origen. Puesto que estamos suponiendo que 
n 4 0 entonces de la ecuación 


ax+by+ez=0 
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puede despejarse alguna variable en términos de las otras dos; sin pérdida de general- 
idad, digamos que es z, es decir, que c 4 0. De tal forma que al dar valores arbitrarios 
a x y y, la fórmula nos da un valor de z, y por tanto un punto x € R* que satisface 
la condición original n - x = 0 —esto equivale a parametrizar las soluciones con R?, 
con dos grados de libertad—. En particular hay una solución u con x=1yy=0 
(a saber, u = (1,0,—a/c)) y una solución v con x =0 y y = 1 (¿cuál es?). Como 
claramente los vectores U y v no son paralelos (tienen ceros en coordenadas distin- 
tas), generan linealmente todo un plano de soluciones (pues para cualquier s,t € R, 
se tiene que n - (su+tv) =s(n-u)+t (n.v) = 0). Falta ver que no hay más 
soluciones que las que hemos descrito, pero esto se lo dejamos al estudiante para el 
siguiente ejercicio, que hay que comparar con este párrafo para entender cómo se llegó 
a su elegante planteamiento. 


EJERCICIO 1.71 Sea n= (a,b,c) tal que a 4 0. Demuestra que 


(x er [n-x=0) =(s (—b,a,0) +t (-c,0,a) |s,te R). 


EJERCICIO 1.72 Describe el plano en ¡R* dado por la ecuación x+y +z= 1. 


“EJERCICIO 1.73 Sea n un vector no nulo en R”. 
a) Demuestra que Vo :=[x € RT |n-x =0) es un subespacio vectorial de R”; es decir, que 
la suma de vectores en V¿ se queda en V¿ y que el “alargamiento” de vectores en Vo también 
está en Vo. 
b) Demuestra que para cualquier d € R, el conjunto Va := (xE€R"|n.x=d) es un 
trasladado de Vo; es decir, que existe un p € R” tal que Va = Vo +p =[u+plue€ Vo). 
c) ¿Qué dimensión dirías que tiene V¿? Argumenta un poco tu respuesta. 


1.9 Norma y ángulos 


Del producto interior, obtendremos la noción de norma o magnitud de los vectores, 
que corresponde a la distancia del punto al origen. 


Definición 1.9.1 Dado un vector v € R”, su norma (o magnitud) es el número real: 
iv] := yv-v, 


de tal manera que la norma es una función de R” en R. 


Como v-.v > 0 (Teorema 1.11), tiene sentido tomar su raíz cuadrada (que a su 
vez se define como el número positivo tal que al elevarlo al cuadrado nos da el dado). 
Se tiene entonces la siguiente fórmula que es una definición equivalente de la norma 


y que será usada con mucho más frecuencia 
A 
(0) iv? =v - v. 
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En R? la norma se escribe, con coordenadas v = (x, y), 
como 


[v[? =x? + y?. 


Entonces |v| corresponde a la distancia euclidiana del origen al punto v = (x,y), 
pues de acuerdo con el Teorema de Pitágoras, x y y son lo que miden los catetos 
del triángulo rectángulo con hipotenusa v. Aquí es donde resulta importante (por 
primera vez) que los ejes coordenados se tomen ortogonales, pues entonces la fórmula 
para calcular la distancia euclidiana al origen a partir de las coordenadas se hace 
sencilla. 


En R3, con coordenadas v = (x, y,z), la norma se escribe 
E] ), ) ? 


w?=x?+y?+2, 


que de nuevo, usando dos veces el Teorema de Pitágoras (en 
los triángulos de la figura) y que la nueva dirección Z es or- 
togonal al plano x, y, corresponde a la magnitud del vector 


v. 

Demostremos primero el Teorema de Pitágoras para vec- 
tores en general. Este teorema fue la motivación básica para 
la definición de norma; sin embargo su uso ha sido sólo ése: 

como motivación, pues no lo hemos usado formalmente sino para ver que la norma co- 
rresponde a la noción euclidiana de distancia al origen (magnitud de vectores) cuando 
los ejes se toman ortogonales entre sí. Ahora veremos que al estar en el trasfondo de 
nuestras definiciones, éstas le hacen honor al hacerlo verdadero. 


Teorema 1.20 (Pitágoras vectorial) Sean u y v dos vec- 
tores en R". Entonces son perpendiculares si y sólo si 


Ss 2 2 
jul? + [v" = ju — vÍ?. 


Demostración. De las propiedades del producto interior (y la definición de norma) 
se obtiene 


hu —vl? (u—v) - (u—v) 


U-U+V-V-U-V VU 


u.u+v-v—-2(u-v) 
lul? + vi? — 2 (uv). 


! 


Por definición, U y V son perpendiculares si y sólo si U- v = 0 y entonces el teorema 
se sigue de la igualdad anterior. O 
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Así que nuestra definición de perpendicularidad (que el producto punto se anule) 
corresponde a que el Teorema de Pitágoras se vuelva cierto. Y entonces ahora tiene 
sentido nuestra manera informal de llamar, en R?, a las soluciones de la ecuación 
u-.x =0 “el plano normal a u”. Pues u-.x = 0 si y solo si los vectores U y X 
son los catetos de un triángulo que cumple el "Teorema de Pitágoras y por tanto es 
rectángulo. 

Las propiedades básicas de la norma se resumen en el siguiente teorema. 


Teorema 1.21 Para todos los vectores v,u € ¡R” y para todo número real t € RR se 
tiene que: 


¿) iv >0 

1) wW=0S5v=0 
12) |tv|= |t| lv] 

iv) [ul+ [v] > [u + v] 
v) lu [v| > lu - v] 


Demostración. La primera afirmacion es consecuencia inmediata de la definición 
de raíz cuadrada, y la segunda del Teorema 1.11. La tercera, donde también se usa 
ese teorema, es muy simple pero con una sutileza: 


ltvl? = (tv) - (tv) = ? (vv) = Y? Jv? 


de donde, tomando raíz cuadrada, se deduce | tv | = |t| |v|. Puesto que Vt? no siempre 
es t sino su valor absoluto |tl, que es positivo siempre (y que podría definirse [t| := 


vt?); nótese además que como |v| > 0 entonces 1/ ivi? = |vl. Obsérvese que para 


n = 1 (es decir, en R) la norma y el valor absoluto coinciden, así que usar la misma 
notación para ambos no causa ningún conflicto. 

El inciso (iv) se conoce como “la desigualdad del triángulo”, pues dice que en 
el triángulo con vértices 0, u y u+v, es más corto ir directamente de O a u+v (|u + vl) 
que pasar primero por u (Jul + |v)). Para demostrarla, 
nótese primero que como ambos lados de la desigualdad 
son no negativos, entonces ésta es equivalente a que la 
misma desigualdad se cumpla para los cuadrados, 1.e., 


u+v 


lul+|v>lu+v > (ful +[w)” > lu +vf. 
Y esta última desigualdad es equivalente a que (Jul + [w))?— 
ju +v!? > 0. Así que debemos desarrollar el lado izquierdo: 


(ful +|v)?—(u+v)-(u+v) 2 


tul? +[v]? +2 lul lv — (u-u +v.v+2(u-v)) 
2 (Jul [v| — (u - v)). 


(ful + [v[)? — Ju + v/? 
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Queda entonces por demostrar que |[u||v| > (u - v), pero esto se sigue del inciso (v), 
que es una afirmación más fuerte que demostraremos a continuación independiente- 
mente. 

El inciso (v) se conoce como “la desigualdad de Schwartz”. Por un razon- 
amiento análogo al del inciso anterior, bastará demostrar que ([ul iv)? — ju vi? es 
positivo. Lo haremos para IR? con coordenadas, dejando el caso de R?, y de R”, como 
ejercicios. Supongamos entonces que u = (a,b) y v= (a, $) para obtener 


ul? iv? —ju-v? = (a+?) (a? +8?) — (aa +b8y 
= do +b*p4 ap? 4 ba? 
— (ata? +b?*8?+2aabB) 
= ap? —2(a8) (ba) + b?a? 
= (aB—baJ">0; 


donde la última desigualdad se debe a que el cuadrado de cualquier número es no 
negativo. Lo cual demuestra la desigualdad de Schwartz, la del Triángulo y completa 
el Teorema. O 


EJERCICIO 1.74 Demuestra que dos vectores U y v son perpendiculares si y sólo si 
lu + v!? = Jul? + |v]?. Haz el dibujo. 

EJERCICIO 1.75 Demuestra que dos vectores U y v son perpendiculares si y sólo 
si ju+v| = j¡u—vl. Haz el dibujo. Observa que este enunciado corresponde a que un 
paralelogramo es un rectángulo si y sólo si sus diagonales miden lo mismo. 

EJERCICIO 1.76 Sean u y v dos vectores no nulos. Demuestra que tienen la misma 
norma si y sólo si U+v y U— v son ortogonales. 

EJERCICIO 1.77 Demuestra la desigualdad de Schwartz en R3. ¿Puedes dar, o des- 
cribir, la demostración en R”? 


1.9.1 El círculo unitario 


A los vectores que tienen norma igual a uno, se les llama vectores 
unitarios. Y al conjunto de todos los vectores unitarios en R? se le 
llama el círculo unitario y se denota con S'. La notación viene de 
la palabra sphere en inglés, que significa esfera; pues en general se 
puede definir a la esfera de dimensión n como 


St=(x ER" | lx] =1). 
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Nótese que el exponente se refiere a la dimensión de la 
esfera en sí, y que ésta necesita una dimensión más para 
“vivir”. Así, la esfera de dimensión 2 vive en R*, y es la 
representación abstracta de las pompas de jabón. Más ade- 
lante la estudiaremos con cuidado. Por lo pronto nos in- 
teresa el círculo unitario. 

Los puntos de S' corresponden a los ángulos, y a estos 
los mediremos con radianes. La definición formal o muy pre- 
cisa de ángulo involucra necesariamente nociones de cálculo 
que no entran en este libro. Sin embargo, es un concepto 
muy intuitivo y de esa intuición nos valdremos. Un ángulo 
es un sector radial del círculo unitario, aunque se denota, 
gráficamente con un arco pequeño cerca del centro para indicar que no depende real- 
mente del círculo de referencia, sino que es más bien un sector de cualquier círculo 
concéntrico. Es costumbre partir el círculo completo en 360 sec- 
tores iguales llamados grados. Resulta conveniente usar el número 
360, pues 360 = 2?325 tiene muchos divisores, así que el círculo se 
puede partir en cuatro sectores iguales de 90 grados (denotado 90? 
y llamado ángulo recto) o en 12 de 30” que corresponden a las horas 
del reloj, etc. Pero la otra manera de medirlos, que no involucra la 
convención de escoger 360 para la vuelta entera, es por la longitud 
del arco de círculo que abarcan; a esta medida se le conoce como 
en radianes. Un problema clásico que resolvieron los griegos con admirable precisión 
fue medir la circunferencia del círculo unitario (de radio uno), es decir, cuánto mide 
un hilo “untado” en el círculo. El resultado, como todos sabemos, es el doble del 
famoso número Tm = 3.14159..., donde los puntos suspensivos indican que su expre- 
sión decimal sigue infinitamente pues no es racional. Otra manera de entender los 
radianes es cinemática y es la que usaremos a continuación para establecer notación; 
es la versión teórica del movimiento de la piedra en una honda justo antes de lanzarla. 

Si una partícula viaja dentro de S' a velocidad constante 1, partiendo del punto 
e; = (1,0) y en dirección contraria a las manecillas del reloj (es decir, saliendo hacia 
arriba con vector velocidad e, = (0, 1)), entonces en un tiempo 0 estará en un punto 
que llamaremos u (0); en el tiempo 711/2 estará en el e, = (0,1) (es decir, u (1/2) = 
ez), en el tiempo 7 en el (—1,0) y en el 277 estará de regreso para 
empezar de nuevo. El tiempo aquí, que estamos midiendo con el 
parametro 0, corresponde precisamente a los radianes, pues al viajar 
a velocidad constante 1 el tiempo es igual a la distancia recorrida. 
Podemos también dar sentido a u(0) para O negativa pensando 


que la partícula viene dando vueltas desde siempre (tiempo infinito 
negativo) de tal manera que en el tiempo 0 pasa justo por e, es 
decir, que 


u(0)]= (1,0). 
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Nuestra suposición básica es que la función u : R > S!, que hemos descrito, está 
A bien definida. Se cumple entonces que 


ON u(9) =u(0+2m). 
hs . > pues en el tiempo 271 la partícula da justo una vuelta (la longitud del 


círculo mide lo mismo independientemente de dónde empecemos a, 
medir). Y también que u(9 +71) = —u(8), pues 7 es justo el 
ángulo que da media vuelta. 

Observemos ahora que al pedir que la partícula viaje en el círculo unitario con 
velocidad constante 1 entonces su vector velocidad, que incluye ahora dirección además 
de magnitud, es tangente a S! (la piedra de la honda sale por la 
tangente), y es fácil ver que entonces es perpendicular al vector 
de posición u (9), pero más precisamente es justo su compadre u(0) 
ortogonal porque va girando en “su” dirección, “hacia él”. Usando 
la notación de derivadas, podríamos escribir 


uv (0) =u(0)”. 


u(0+r) 


Hay que remarcar que al medir ángulos con radianes, si bien ganamos en natural- 
idad matemática, es inevitable la ambigúedad de que a los ángulos no corresponda 
un número único. Pues O y 0 + 2n1r, para cualquier n € Z, determinan al mismo 
ángulo, es decir u (9) =u (0 + 2n11). Podemos exigir que O esté en el intervalo entre 
0 y 2rt, o bien, que resulta más agradable geométricamente, en el intervalo de —1 a 
TT, para reducir la ambigiiedad sólo a los extremos. Pero al sumar o restar ángulos, 
inevitablemente nos saldremos de este intervalo y habrá que volver a ajustar. 


Funciones trigonométricas 


Recordemos ahora que S! es un subconjunto de R?, así que el punto u(8) tiene dos 
coordenadas precisas. Estas están dadas por las importantísimas funciones trigono- 
métricas coseno y seno. Más precisamente, podemos definir 


(cos 6, sen 0) := u(8), 


es decir, cos8 y sen8 son las coordenadas cartesianas del 
punto u(8) e S'. Entonces el coseno y el seno corresponden 
respectivamente al cateto adyacente y al cateto opuesto de 
un triángulo rectángulo con hipotenusa 1 y ángulo 0, como 
se ve en trigonometría de secundaria. También pensarse que 
si damos por establecidas las funciones seno y coseno, en- 
tonces la función u (0) está dada por la ecuación anterior. Hay que remarcar que la 
pertenencia u(9) € S' equivale entonces a la ecuación 


sen? 8 + cos? 8 = 1. 
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Las propiedades de la función u que hemos enumerado, traducidas a sus coorde- 
nadas (por ejemplo, la del vector velocidad se traduce a cos' 9 = —sen0 y sen' 0 = 
cos 0) son suficientes para definir a las funciones cos y sen, y en adelante las daremos 
por un hecho. Sus bien conocidas gráficas aparecen en la figura. 

Observemos, por último, que cualquiera de las fun- 
ciones coseno o seno casi determinan al ángulo, pues 
de la ecuación anterior se pueden despejar con la am- 
bigúiedad de un signo al tomar raíz cuadrada, es decir, 


sen 9 = +vy1 — cos? 0. 


Dicho de otra manera, dado x en el intervalo de —1 
a 1 (escrito x € [-1,1],* o bien —1 < x < 1) ten- E = 
emos dos posibles puntos en S' con esa ordenada, a 1 


saber (x, VI=32) y (x, VT=32). Entonces con 


la ambigúedad de un signo podemos determinar el ángulo del cuál x es el coseno. 
Si escogemos la parte superior del círculo unitario obtenemos una función, llamada 
arcocoseno y leída “el arco cuyo coseno es ...” 


E arccos : [-1,1] = [0,77], 
y definida por 


cos (arccos (x)) = x. 


O 1 La ambigiiedad surge al componer en el otro sentido, 

pues para O € [—1,11] se tiene arccos (cos (8)) = +0. 
Obsérvese que entonces la mitad superior del círculo unitario se describe como la 
eráfica de la función x + sen (arccos (x)). 


EJERCICIO 1.78 Demuestra (usando que definimos u(9) e S!) que para cualquier 
0 ER se cumplen 


—] sen0 < 1 
EJERCICIO 1.79 Demuestra que para cualquier 6 € IR se cumplen 


cos (0 + 711/2) =—sen9 cos(0+ 711) =—cosg8  cos[(—B) =cos0 
sen (0 +71/2) =cos8 sen(0 +71) =—send sen (—0) = —sen 6 


EJERCICIO 1.80 Construye una tabla con los valores de las funciones cos y sen para 
los ángulos 0,71/6,71/4,71/3,77/2,21/3,31/4,51/6,7,571/4,31/2, —1/3, —1/4, y dibuja los 
correspondientes vectores unitarios. 


Dados a,b € R, con a < b, denotamos por [a,b] :=[xE€R|a<x<b) al intervalo cerrado 
entre a y b. 
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EJERCICIO 1.81 ¿Cuál es el conjunto de números que usan las coordenadas de las 
horas del reloj? 


1.9.2 Coordenadas polares 


El círculo unitario S' (cuyos puntos hemos identificado con los ángulos tomando su 
ángulo con el vector base e; = (1,0)) tiene justo un representante de cada posible 
dirección en R?, donde ahora una dirección y su opuesta son diferentes (aunque sean, 
según nuestra definición, paralelas). De tal manera que a cualquier punto de R? que 
no sea el origen se llega viajando en una (y exactamente una) de estas direcciones. 
Ésta es la idea central de las coordenadas polares, que en muchas situaciones son 
más naturales, o útiles, para identificar los puntos del plano. Por ejemplo, son las 
que intuitivamente usa un cazador: apuntar —decidir una dirección— es la primera 
coordenada y luego, dependiendo de la distancia a la que vuela el pato —la segunda 
coordenada— tiene que ajustar el tiro para que las trayectorias de pato y perdigones 
se intersecten. 

Sea x cualquier vector no nulo en R?. Entonces [x| 4 0 y tiene sentido tomar el 


vector (be) x, que es unitario pues como |x| > 0 implica que |x|? > 0, entonces 
tenemos 
[ha] = 7] bel =|x17" bel =1. 


De aquí que exista un único u (9) € S' (aunque 8 no es único como A 
real, sí lo es como ángulo), tal que 


u (9) =|kxx 7 10) 
y claramente se cumple que UY 


A u(0) se le referirá como la dirección de Xx. A la pareja (6, [x|) se le llama las 
coordenadas polares del vector x. Se usa el término “coordenadas” pues determinan 
al vector, es decir, si nos dan una pareja (0, p) con p > 0, obtenemos un vector 


x= lx] u(e). 


Xx x=pu(e) 


con magnitud p y dirección u (0), o bien, ángulo O. Obsérvese 

e que sólo con el origen hay ambigiúedad: si p = 0 en la formúla 
anterior, para cualquier valor de 6 obtenemos el origen; éste no 

tiene un ángulo definido. Así que al hablar de coordenadas polares 

> supondremos que el vector en cuestión es no nulo. Por nuestra 


convención de u (8), lo que representa 0 es el ángulo respecto al 
eje x en su dirección positiva. 
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EJERCICIO 1.82 Da las coordenadas (cartesianas) de los vectores cuyas coordenadas 
polares son (1/2, 3) ), (7/4, vz 2), (1/6,2), (m/6, 1). 


EJERCICIO 1.83 Si tomamos (9,p) como coordenadas polares, describe los subcon- 
juntos de R? definidos por las ecuaciones € = cte (“9 igual a una constante”) y p =cte. 


1.9.3 Ángulo entre vectores 


Podemos usar coordenadas polares para definir el ángulo entre vectores en general. 


Definición 1.9.2 Dados x y y, dos vectores no nulos en R?, sean (a, xl) y (B,lyl) 
sus coordenadas polares respectivamente. El ángulo de x a y es 


Xx ang (x,y) =$ — a. 
Obsérvese que el ángulo tiene dirección (de ahí que le hayamos 
puesto la flechita de sombrero), ya que claramente 


ang (x, y) = —ang (y, x). 


Q Pues ang (x, y) corresponde al movimiento angular que nos lleva 


> 
de la dirección de x a la de y, y ang (y,x) es justo el movimiento 
inverso. Así que podemos resumir diciendo que las coordenadas polares de un vector 
x (recúerdese que al aplicar el término ya suponemos que es no nulo) es la pareja 


(ang (e1,x), lx). 


Con mucha frecuencia van a aparecer ángulos no dirigidos, pensados como un 
sector del círculo unitario sin principio ni fin determinados. Para ellos usaremos 
la notación ang (x,y) (sin la flecha), llamándolo el ángulo entre x y y. Aunque 
intuitivamente es claro lo que queremos (piénsese en una porción de una pizza), su 
definición es un poco más laboriosa. Si tomamos dos vectores unitarios en S!, estos 
parten el círculo en dos sectores, uno de ellos es menor que medio círculo y ése es el 
ángulo entre ellos. Así que debemos pedir que 


0<ang[(x,y)<T. 


Y es claro que escogiendo a x y a 3 (los ángulos de x y y, respectivamente) de 
manera adecuada se tiene que ang (x, y) := [B — al € [0,71]. Así que, por ejemplo, 
ang (x,y) = 0 significa que X y y apuntan en la misma dirección, mientras que 
ang (x, y) = T significa que X y y apuntan en direcciones contrarias, y se tiene que 
ang (x, y) = 1/2 cuando son perpendiculares. 


EJERCICIO 1.84 ¿Cuál es el ángulo de x a y, cuando a) x = (1,0),y = (0,—2); b) 
x=(1,),y=(0,1); e) x= (v3,2), y = 10): 
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Si ya definimos ángulo entre vectores, resulta natural definir ángulo entre dos rectas 
como el ángulo entre sus vectores direccionales. Pero hay una am- 


bigúedad pues podemos escoger direcciones opuestas para una misma 
recta. Esta ambigiiedad equivale a que dos rectas que se intersectan 
definen cuatro sectores o “ángulos” que se agrupan naturalmente en 
dos parejas opuestas por el vértice que miden lo mismo; y estos dos án- 
gulos son complementarios, es decir, suman 7. No vale la pena entrar 
en los detalles formales de esto usando vectores direccionales pues sólo 
se confunde lo obvio, que desde muy temprana edad sabemos. Pero 
sí podemos delinear rápidamente la demostración de que la suma de 


los ángulos de un triángulo siempre es TT, que para Euclides tuvo que ser axioma 


(disfrazado o no, pues recuérdese que es equivalente al Quinto). 


Un triángulo son tres rectas que se intersectan dos a dos (pero no las tres), y en 
cada vértice (la intersección de dos de las rectas) define un ángulo interno; llamémoslos 


o, B y y. Al trazar la paralela a un lado del triángulo que 
pasa por el vértice opuesto (usando el Quinto), podemos 
medir ahí los tres ángulos, pues por nuestra demostración 
del Quinto esta paralela tiene el mismo vector direccional 
que el lado original, y nuestra definición de ángulo en- 
tre líneas usa la de ángulo entre vectores direccionales. 
Finalmente, hay que observar que si en ese vértice cambi- 
amos uno de los ángulos por su opuesto, los tres ángulos 
se juntan para formar el ángulo de un vector a su opuesto, 
es decir, suman 71. Hemos delineado la demostración del 
siguiente teorema clásico. 


Teorema 1.22 Los ángulos internos de un triángulo suman T. 


1.10 Bases ortonormales 


Definición 1.10.1 Una base ortonormal de R? es una pareja de vectores unitarios 


perpendiculares. 


Por ejemplo, la base canónica e; = (1,0), ez, =(0,1) es una base 
ortonormal, y para cualquier u € S! se tiene que u, u” es una base 
ortonormal, pues también lu = 1. Obsérvese además que si u y 
v son una base ortonormal entonces ambos están en S' y además 
v=u'* o. v=-—u?. Por el momento, su importancia radica en que 
es muy fácil escribir cualquier vector como combinación lineal de una 
base ortonormal: 


S 
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Teorema 1.23 Sean u y v una base ortonormal de R?, entonces para cualquier x € 
R? se tiene que 


x= (x-u)u+(x-v)v. 


Demostración. Suponemos que Xx está dado, y vamos a resolver el sistema de ecua- 
ciones 


su+tv=x (1.11) 
con incógnitas t, s. Tomando el producto interior con u en la ecuación 
anterior obtenemos 


s(u-u)+t(v.u)=x-u. 


Pero u.u=1T1 pues u es unitario y v-u = 0 ya que u y v son 
perpendiculares, así que 
$ =X-Uu. 


Análogamente, tomando el producto interior por v, se obtiene que t =X- v. De tal 
manera que el sistema (1.11) sí tiene solución y es la que asegura el teorema. Ol 


Vale la pena observar que el truco que acabamos de usar para resolver un sistema 
de dos ecuaciones con dos incógnitas no es nuevo, lo usamos en la Sección 1.7.1 al 
tomar el producto interior con el compadre ortogonal; la diferencia es que aquí el otro 
vector de la base ortonormal está dado. 

Como corolario de este teorema obtenemos la interpretación geométrica del pro- 
ducto interior de vectores unitarios. 


Corolario 1.24 Si u, v € S! y a es el ángulo entre ellos, i.e., xa = ang (u, v), 
entonces 
U-V=COsSQ. 


Demostración. Sea f = ang (u,v) el ángulo de u a v, de tal manera que, 
escogiéndolos adecuadamente, se tiene que x = +(3. Usando el teorema anterior con 
la base ortonormal u, u- y el vector v (en vez de x) se obtiene 


v=(v-u)u+ (v-u+)u?. 


Pero también es claro geométricamente que 


v=cosfu-+senfu”. 


Puesto que cos [3 = cos x, pues x = +f, el corolario se sigue de que la solución de 
un sistema con determinante no cero es única (en nuestro caso el determinante del 
sistema v =su +tul es det (u,u*) =u* .u* =1). En 
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EJERCICIO 1.85 Demuestra que si u, v y w son una base ortonormal de R* (es decir, 
si los tres son unitarios y dos a dos son perpendiculares), entonces para cualquier x € R* se 
tiene que 

x=(x-u)u+(x-.v)v+(x-w)w. 
EJERCICIO 1.86 Escribe los vectores (1,0), (0,1), (2,1) y (—1,3) como combinación 
lineal de u = (3/5,4/5) y v = (4/5, —3/5), es decir, como tu + sv con t y s apropiadas. 


1.10.1 Fórmula geométrica del producto interior 


Como consecuencia del corolario anterior obtenemos un resultado importante que nos 
dice que el producto interior puede definirse en términos de la norma y el ángulo entre 
vectores. 


Teorema 1.25 Sean u y v dos vectores en R? y a el ángulo entre ellos, MY 
entonces 


u - v = ul |v|cos a. 5 


Demostración. Si u = 0 (o v= 0) la igualdad anterior se cumple (pues ambos lados 
son 0); podemos suponer entonces que ambos son distintos de cero. Ahora podemos 
reescalar a u (y a v) para ser unitarios (pues tiene sentido (jul? )u que es un vector 
unitario) manteniendo el ángulo entre ellos. Y por el Corolario 1.24, 


1 1 u-v 
cos í = (—Ju-(—)v = ; 
ul” ol ul [vl 
de donde se sigue imediatamente el teorema. O 


De esta fórmula geométrica para el producto interior, se obtiene que |u - v| = 
[cos al jul [v| , así que la desigualdad de Schwartz (ju - v| > Jul [v|) es equivalente a 
[cos al < 1. 


EJERCICIO 1.87 Demuestra la ley de los cosenos para vectores, es decir, que dados 
dos vectores u,v € R? con ángulo a entre ellos, se cumple que 


hu — vl? = jul? + [vi? — 2 jul lv] cos a. 


Observa que el Teorema de Pitágoras es un caso especial. 


EJERCICIO 1.88 Encuentra la distancia de los puntos p¡ = (0,5), p2 = (4,0) y 
Pp3 = (-1,1) a la recta l =([t(4,3) |t € RJ. 
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1.10.2 El caso general 


Puesto que el Teorema 1.23 y su Corolario 1.24 se demostraron para ¡R?, puede dudarse 
de la validez de los resultados en el caso general de RR”, pero nos interesa establecer 
el caso de n = 3. Vale la pena entonces hacer unas aclaraciones y ajustes a manera 
de repaso. Lo que realmente se uso del Teorema 1.23 fue que cuando u es un vector 
unitario (en cualquier dimensión ahora) entonces x - u tiene un significado geométrico 
muy preciso: es lo que hay que viajar en la dirección u para que de ahí, x quede en 
dirección ortogonal a u. Podemos precisarlo de la siguiente manera. 


Lema 1.26 Sea u € R” un vector unitario (es decir, tal que jul =1). Entonces para 
cualquier x € ¡R” existe un vector y perpendicular a u y tal que 


x=(x-uju+y. 
Demostración. Es muy fácil, declaremos y := x— (x-u) u y basta ver que y-u =0: 


y.u = (x-(x-u)u)-.u 


x-u—(x-u)u-.u) =x-u—x-.u=0. 


O 


Si pensamos ahora en el plano generado por u y X (en el que también se encuentra 
y) y dentro de él en el triángulo rectángulo 0, (x - u) u,x, se obtiene que 


x-u 
COS A = ——, 
Ix 
donde «a es el ángulo entre los vectores u y Xx. Y de aquí, el 'Teo- 
rema 1.25 para [R” se sigue inmediatamente al permitir que u sea no 
necesariamente unitario. 

Si nos ponemos quisquillosos con la formalidad, se notará una 
falla en lo anterior (pasamos un strike al lector), pues no hemos 
definido “ángulo entre vectores” más allá de R?. Tómese entonces como la moti- 
vación intuitiva para la definición general que hará que todo cuadre bien. 


Definición 1.10.2 Dados dos vectores no nulos u y v en R” el ángulo entre ellos es 


u-v 
ang (u, v) = arccos (na) j 


ul [v! 


Nótese que por la desigualdad de Schwartz (dejada al lector para IR* en el Ejer- 
cicio 1.77) el argumento de la función arccos está en el intervalo [—1, 1], así que está 
bien definido el ángulo, y queda en el intervalo [0, 71]. 

Hay que remarcar que a partir de I¡R3 ya no tiene sentido hablar de ángulos di- 
rigidos; esto sólo se puede hacer en el plano. Pues si tomamos dos vectores no nulos 
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u y ven R*, no hay manera de decir si el viaje angular de u hacia v es positivo o 
negativo. Esto dependería de escoger un lado del plano para “verlo” y ver si va contra 
o con el reloj, pero cualquiera de los dos lados son “iguales” y desde cada uno se “ve” 
lo contrario del otro; no hay una manera coherente de decidir. Lo que sí se puede 
decir es cuándo tres vectores están orientados positivamente, pero esto se verá mucho 
más adelante. De tal manera que a partir de R*, sólo el ángulo entre vectores está 
definido, y tiene valores entre 0 y 7t; donde los extremos corresponden a paralelismo 
pero con la misma dirección (ángulo 0) o la contraria (ángulo 71). 


EJERCICIO 1.89 Sean u y v dos vectores unitarios y ortogonales en R?. Demuestra 
que para cualquier x € IR? existe un único w € (u,v) (el plano generado por u y v) tal que 
Xx — W es ortogonal a u y a v; al punto w se le llama la proyección ortogonal de x al plano 
(u, v). ¿Puedes concluir que la distancia del punto x al plano (u, v) es 


x[? — (x - u) 


1.11 Distancia 


Esta sección cierra el capítulo con una breve discusión sobre el concepto euclidiano 
de distancia, que se deduce naturalmente de la norma 

Dados dos puntos p, q € R” se puede definir su distancia euclidiana, o sim- 
plemente su distancia, d(p, q), como la norma de su diferencia, es decir, como la 
magnitud del vector que lleva a uno en otro, 1.e., 


d(p, q) = Ip — al, EN 


que explícitamente en coordenadas da la fórmula (en R?) p 
d((xa1,y1), (x2,42)) = Y 0a — 2) + (y1 — ya). 


Las propiedades básicas de la distancia se reúnen en el siguiente: 


Teorema 1.27 Para todos los vectores x,y,z € RR” se cumple que 


i) d(x,y)>0 

a) dx,y)=05x=y 

11) d(x,y) = d(y,x) 

iv) d(x,y) < d(x,z) + d(z, y). 


El espacio métrico es un conjunto en el que está definida una distancia que cumple 
con las cuatro propiedades del Teorema, 1.27. 
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EJERCICIO 1.90 Da explícitamente con coordenadas la fórmula de la distancia en R3 
y en RR”. 

EJERCICIO 1.91 Demuestra el Teorema 1.27. 

EJERCICIO 1.92 ¿Podrías mencionar algún espacio métrico distinto del que se definió 
arriba? 


1.11.1 El espacio euclidiano (primera misión cumplida) 


Cuando R” se considera junto con la distancia antes definida (llamada la distancia 
euclidiana), se dice que es el espacio euclidiano de dimensón n —que a veces se denota 
E”, y que formalmente podríamos definir JE” := (IR”, d) — ya que éste cumple con los 
postulados de Euclides para n = 2. Veamos. 

Hemos demostrado que R? cumple los tres postulados que se refieren a las rectas, 
y aún nos falta analizar dos. El II se refiere a “trazar” círculos. Ya hemos trabajado 
con el círculo unitario y claramente se generaliza. Dado un punto p y una distancia Y 
(un número positivo) definimos el círculo con centro p y radio r como el conjunto de 
puntos a distancia r de p (que se estudiará en el siguiente capítulo). Se trata de cierto 
subconjunto de ¡R?, que además es no vacío (es fácil dar explícitamente un punto en 
él usando coordenadas); y nuestra noción de “definir” un conjunto es la análoga de 
“trazar” para los griegos. Se cumple entonces el axioma II. 

Nos falta únicamente discutir el IV, “todos los ángulos rectos son iguales”. Esta 
afirmación es sutil. Tenemos, desde hace un buen rato, la noción de ángulo recto, 
perpendicularidad u ortogonalidad, pero ¿a qué se refiere la palabra “igualdad” en 
el contexto griego? Si fuera a la igualdad del numerito que mide los ángulos, la 
afirmación es obvia, casi vacua —“11/2 es igual a 11/2”—, y no habría necesidad de 
enunciarla como axioma. Entonces se refiere a algo mucho más profundo. En este 
postulado está implícita la noción de movimiento; se entiende la “igualdad” como 
que podemos mover el plano para llevar un ángulo recto formado por dos rectas a 
cualquier otro. Esto es claro al ver otros teoremas clásicos como “dos triángulos son 
iguales si sus lados miden lo mismo”: no se puede referir a la igualdad estricta de 
conjuntos, quiere decir que se puede llevar a uno sobre el otro para que, entonces 
sí, coincidan como conjuntos. Y este llevar es el movimiento implícito en el uso 
de la palabra “igualdad”. En términos modernos, esta noción de movimiento del 
plano se formaliza con la noción de función. Nosotros lo haremos en el capítulo 3, 
y corresponderá formalmente a la noción de isometría (una función de R? en R? 
que preserva distancias). Pero ya no queremos distraernos con la discusión de la 
axiomática griega. Creamos de buena fe que al desarrollar formalmente los conceptos 
necesarios el Postulado IV será cierto, o tomémoslo en su acepción numérica trivial, 
para concluir esta discusión con la que arrancamos el libro. 

A partir de los axiomas de los números reales construimos el Plano Euclidiano, 
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E?, con todo y sus nociones básicas que cumplen los postulados de Euclides. Se tiene 
entonces que para estudiarlo son igualmente válidos el método sintético (el que usaban 
los griegos pues sus axiomas ya son ciertos) o el analítico (que inauguró Descartes y 
estamos siguiendo). En este último método siempre hay elementos del primero, no 
siempre es más directo irse a las coordenadas; no hay un divorcio y en general es muy 
difícil trazar la línea que los separa; además no vale la pena. No hay que preocuparse 
de eso, en cada momento toma uno lo que le conviene. Pero sí hay que hacer énfasis 
en la enorme ventaja que dio el método cartesiano, al construir de golpe (y sólo con 
un poco de esfuerzo extra) espacios euclidianos para todas las dimensiones. Es un 
método que permitió generalizar y abrir, por tanto, nuevos horizontes. Y no sólo en 
cuestión de dimensiones. 

Como se verá en capítulos posteriores, siguiendo el método analítico pueden con- 
struirse espacios de dimensión 2 con formas “raras” de medir ángulos y distancias 
que los hacen cumplir todos los axiomas menos el Quinto, y haciéndolos entonces 
espacios no euclidianos. Pero esto vendrá a su tiempo; por el momento y para cerrar 
el círculo de esta discusión, reescribiremos con la noción de distancia el Teorema 1.1, 
cuya demostración se deja como ejercicio, y donde, nótese, tenemos el extra del “si y 
sólo si”. 

Se puede definir ángulo en tercias ordenadas de puntos. De nuevo, 
refiriéndonos al ángulo que ya definimos entre vectores (haciendo que 
el punto de enmedio sea como el origen): 


(x—y) - (2—y) 


Zxyz := ang ((x— y), (z — = arccos == ——. 
yz:=ang ((x— y), (z—y)) Ea 


Y entonces tenemos: 


Teorema 1.28 (Pitágoras) Dados tres puntos X, Y, z en 
E", se tiene que Z 


d(x, 2)? =d(x, y)? +d(y, 2? S Zxyz=x/2. 


O y 


Para retomar el hilo de la corriente principal del texto, en los siguientes ejercicios 
vemos cómo con la noción de distancia se pueden reconstruir objetos básicos como 
segmentos y rayos, que juntos dan las líneas; y delineamos un ejemplo de un espacio 
métrico que da un plano con una geometría “rara”. 


EJERCICIO 1.93 Demuestra esta versión del Teorema de Pitágoras. 
EJERCICIO 1.94 Demuestra que el segmento de x a y es el conjunto 


xy =12 | d(x,y) = d(x, 2) + díz, y)). 
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EJERCICIO 1.95 Demuestra que el rayo que parte de y desde x (es decir la continuación 
de la recta por x y y más allá de y) es el conjunto [z | d(x, y) + d(y,z) = d(x, z)). 


*EJERCICIO 1.96 (Un ejemplo cotidiano de otro espacio métrico). El plano con la 
métrica de “Manhattan” (en honor de la famosísima y bien cuadriculada ciudad) se define 
como R? con la función de distancia 


dm((x1,x2), (y1, y2)) := ly1 — x1l + ly2a — x2l; 


pensando que para ir de un punto a otro sólo se puede viajar en dirección horizontal o 
vertical (como en las calles de una ciudad). 

a) Demuestra que la métrica de Manhattan cumple el Teorema 1.27. 

b) Dibuja el conjunto de puntos con distancia 1 al origen; ¿cómo son los círculos? 

c) ¿Cómo son los segmentos (definidos por la distancia como en el ejercicio anterior)? 

d) ¿Cómo son los rayos? 


1.11.2 Distancia de un punto a una recta 


Consideremos el siguiente problema. Nos dan una recta 
fl: n-x=cC 


y un punto p (que puede estar fuera o dentro de ella); y se nos 
pregunta cuál es la distancia de p a f, que podemos denotar con 
dí(p,2). 

Es más fácil resolverlo si lo pensamos junto con un problema 
aparentemente más complicado: ¿cuál es el punto de l más cer- 
cano a p? Llamémoslo q € fl, aunque sea incógnito. El meollo del asunto es que la 
recta que pasa por p y q debe ser ortogonal a l. Es decir, si el segmento pq es ortog- 
onal a l entonces q es el punto en l más cercano a p. Para demostrarlo considérese 
cualquier otro punto Xx € l y el triángulo rectángulo x, q, p y apliquése el Teorema 
de Pitágoras para ver que d(x,p) > d(q,p). Como la dirección ortogonal a l es 
precisamente n, entonces debe existir t € IR tal que q —-p = tn. La nueva incóg- 
nita t nos servirá para medir la distancia de p a fl. Tenemos entonces que nuestras 
incógnitas q y t cumplen las siguientes ecuaciones: 


n. q q = c 
q4—p = tn, 


donde la primera dice que q € l y la segunda que el segmento pq es ortogonal a f. 
Tomando el producto interior de n con la segunda ecuación, obtenemos 


n-q-n-p=t(n-n). 


1.11. DISTANCIA 61 


De donde, al sustituir la primera ecuación, se puede despejar t (pues n 4 0) en puros 
términos conocidos: 


c-(n-p) = tín-m) 
pa c—(n-p) 
nn 


De aquí se deduce que 


e Ep) 
o p+( n-n E 


d(p,) = ltnl=|t|ni 
ESA lc — (n - p)| 


n-n] in] 


Puesto que sólo hemos usado las propiedades del producto interior y la norma, 
sin ninguna referencia a las coordenadas, podemos generalizar a R*; o bien a R” 
pensando que un hiperplano (definido por una ecuación lineal n -x = C) es una recta 
cuando n = 2 y es un plano cuando n = 3. 


Proposicion 1.29 Sea Il un hiperplano en IR” dado por la ecuación N -X =C, y sea 
p€R" cualquier punto. Entonces 


y la proyección ortogonal de p sobre TI (es decir, el punto más cercano a p en TI) es 
c-n-p 
= ——— In 
ar (2) 


EJERCICIO 1.97 Evalúa las dos fórmulas de la Proposición 1.29 cuando p € IT. 
EJERCICIO 1.98 Encuentra una expresión para d(p,l) cuando l =[q +tv|teR). 


EJERCICIO 1.99 Demuestra que la fórmula de la distancia de un punto a un plano 
obtenida en el Ejercicio 1.89 coincide con la de la Proposición 1.29. 


EJERCICIO 1.100 Encuentra la distancia del punto ... a la recta ... y su proyección 
ortogonal. 


1.11.3 El determinante como área dirigida 


No estamos en posición de desarrollar una teoría general de la noción de área; para 
ello se requieren ideas de cálculo. Pero sí podemos trabajarla para figuras simples 
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como triángulos y paralelogramos. Se define el área de un paralelogramo de manera 
euclidiana (como en secundaria), es decir, (base) x (altura). Veremos que se calcula 
con un viejo conocido. 

Nos encontramos primero el determinante asociado a sistemas de dos ecuaciones 
lineales con dos incógnitas. Después, definimos el determinante de dos vectores en 
R?, otra vez por sistemas de ecuaciones y vimos que detecta (cuando es cero) el 
paralelismo. Ahora podemos darle una interpretación geométrica en todos los casos. 


Teorema 1.30 Sean u y v dos vectores cualesquiera en R?. El área del paralelo- 
gramo que definen u y v es [det (u, v)|. Además det (u,v) > 0 cuando el movimiento 
angular más corto de u a v es positivo (amg (u,v) € [0,77 ) y det (u,v) < 0 cuando 


ang (u,v) e [—1,0). 


Demostración. Podemos tomar como base del paralelogramo 

en cuestión al vector u, es decir, (base) en la fórmula (base) x 

(altura) es [ul, y suponemos que u 4 0. La altura, h digamos, 

es entonces la distancia de v, pensado como punto, a la recta l v 
generada por u. Esta recta tiene ecuación normal u+ -x = 0. 7 
Entonces, por la Proposición 1.29 se tiene que 


Al multiplicar por la base se obtiene que el área del paralelogramo es el valor absoluto 
del determinante 
[uv] 
¡ul 


lu] = |u” - v| = [det (u, v)!. 


Para ver lo que significa el signo de det (u, v), obsérvese que la recta l, generada 
por u, parte el plano en dos semiplanos. En uno de ellos se 


£ encuentra su compadre ortogonal u”, éste es el lado positivo, pues 
LS al tomar c > 0 las ecuaciones u” -x =c definen rectas paralelas a 


l, y una de ellas (cuando c = lu” > 0) pasa por u*; como estas 
rectas llenan (“ashuran”) todo ese semiplano, entonces u+.v > 0 
si y sólo si v está en el lado positivo de l. Análogamente, u--v < 0 


si y sólo si v está en el mismo lado de £ que —u=, que llamamos 


v 


el lado negativo. 
O 


De esta manera, el determinante es un “área signada”: no sólo nos da el área 
sino que también nos dice si los vectores están orientados positiva o negativamente. 
Obsérvese que nuestra manera de detectar el paralelismo corresponde entonces a que 
el área es cero (que el paralelogramo en cuestión es unidimensional). 
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EJERCICIO 1.101 — El área signada de un triángulo orientado X, Y, Z Z 
se debe definir como det ((y —x), ([(z—x)). Demuestra que sólo depende 

del orden cíclico en que aparecen los vértices, es decir, que da lo mismo si 

tomamos como ternas a Y, Z,X0aZz, Xx, y. Pero que es su inverso aditivo Xx 

si tomamos la otra orientación Z, y, X para el triángulo. y: 


1.11.4 La mediatriz 


Cuando empecemos a estudiar las curvas cónicas, las definiremos 
como lugares geométricos de puntos que cumplen cierta propiedad 
que involucra distancias. Así que para terminar este capítulo veremos 
los ejemplos más sencillos. 

Dados dos puntos p y q (€ R?), ¿cuál es el lugar geométrico de 
los puntos que equidistan de ellos? Es decir, hay que describir al 
conjunto 


fx e R? | d(p,x) = d(q,x)). 


Al desarrollar la ecuación d(p, x)? = d(q, x)?, que equivale a la anterior pues las 
distancias son positivas, tenemos 


(p=x)-(p-x) = (q —x)-(q —x) 
P-P-2(p:-x)+x-x = q:q—2(q:x)+x-x 
pP-p-q:q = 2(p-q)-:x 


que se puede reescribir como 


Pa) x=(p-a)- (Sp + 9). 


Y ésta es la ecuación normal de la recta ortogonal al segmento pq y que lo intersecta 
en su punto medio, llamada la mediatriz de p y q. 


EJERCICIO 1.102 ¿Cuál es el lugar geométrico de los puntos en R3 que equidistan de 
dos puntos? Describe la demostración. 


1.11.5  Bisectrices y ecuaciones unitarias 
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Preguntamos ahora cuál es el lugar geométrico de los puntos que equidistan de dos 
rectas l; y l?. De todas las ecuaciones normales que definen a estas rectas, conviene 
escoger una donde el vector normal es unitario para que las distancias 
sean más fáciles de expresar. Tal ecuación se llama unitaria y se obtiene 
de cualquier ecuación normal dividiendo —ambos lados de la ecuación, 
por supuesto— entre la norma del vector normal. Sean entonces u;, 
u, ES! y cy, c7 ER tales que para i=1, 2 


Ll; :U¡ Xx =Ci. 


Por la fórmula de la sección 1.11.2 se tiene entonces que los puntos Xx que equidistan 
de l¡ y fl son precisamente los que cumplen con la ecuación 


jus -x— ci] = [uz -x—c2l. 


Ahora bien, si el valor absoluto de dos números reales coincide entonces o son 
iguales o son inversos aditivos, lo cual se expresa elegantemente de la siguiente manera: 


laj=[b S  (a+b)(a—b)=0, 


que, aplicado a nuestra ecuación anterior, nos dice que el lugar geométrico que estamos 
buscando está determinado por la ecuación 


(u; -x—C1 +U-x—C2) (Us -x—C1 U7-x+Cc9) = O 
(17 ue) «(e +6) (uu —u)-* le —e)) = 0. 


Como cuando el producto de dos números es cero alguno de ellos lo es, entonces 
nuestro lugar geométrico es la unión de las dos rectas: 


By:  (u +u)-x=(c, +c2) (1.12) 
Ba: (uu —uz)-x= (c1 —c2), 


que son las bisectrices de las lineas l; y l,. Observemos que 
son ortogonales pues 


(u +87) -(u —u) = [ul*— uz! 
J-—1 
"0 


y, geométricamente, bisectan a los dos sectores o ángulos que forman las rectas; 
también pasan por el punto de intersección pues sus ecuaciones se obtienen sumando y 
restando las ecuaciones originales (el caso en que sean paralelas se deja como ejercicio). 
En el círculo unitario tambien es claro que la suma y la diferencia de dos vectores 
(aunque ya no sean necesariamente unitarios) tienen los ángulos adecuados. 
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Como corolario, obtenemos otro de los teoremas clásicos de concurrencia. 
Teorema 1.31 Las bisectrices (internas) de un triángulo son concurrentes. 


Demostración. Sólo hay que tener cuidado con cuáles ecuaciones unitarias traba- 
jamos, pues hay dos posibles para cada recta. Si escogemos los vectores unitarios de 
las tres rectas, l;, l2 y l3 digamos, apuntando hacia adentro del 
triángulo, u¡, U> y Uz respectivamente, entonces está claro que 
sus sumas son normales a las bisectrices exteriores. El teorema 
habla entonces de las bisectrices que se obtienen como diferen- 
cias, que son, numerándolas por el índice de la recta opuesta: 


By :  (u—uz)-x= (cz —c3) 
Bz : (Us 11) = (03 =€1) 
Bo:  (u —=uz)-x= (c1 =cz). 


El negativo de cualquiera de ellas se obtiene sumando las otras 
dos. 
O 


EJERCICIO 1.103 Un argumento aparentemente más elemental para el teorema ante- 
rior es que si un punto está en la intersección de dos bisectrices, entonces ya equidista de las 
tres rectas y por tanto también está en la bisectriz del vertice restante. ¿Qué implica este 
argumento cuando tomamos bisectrices exteriores? ¿En dónde concurren dos bisectrices 
exteriores? ¿Una interior y una exterior? Da enunciados y demuéstralos con ecuaciones 
normales. Completa el dibujo. 

EJERCICIO 1.104 Demuestra que el lugar geométrico de los puntos que equidistan a 


dos rectas paralelas es la paralela a ambas que pasa por el punto medio de sus intersecciones 
con una recta no paralela a ellas, a partir de las ecuaciones (1.12). 


EJERCICIO 1.105 ¿Cuál es el lugar geométrico de los puntos que equidistan de dos 
planos en R?? Describe una demostración de tu aseveración. 


1.12 *Los espacios de rectas en el plano 


Esta sección “asterisco” o extra es, hasta cierto punto, independiente del texto prin- 
cipal; será relevante como motivación hasta el capítulo 6, donde se estudia el plano 
proyectivo y cristaliza en la llamada “dualidad”. Estudiaremos dos ejemplos que ya 
están a la mano de cómo la noción de el Espacio, que por milenios se consideró única 
y amorfa —“el espacio en que vivimos”—, se pluraliza los espacios. Ya vimos que 
el Espacio teórico que consideraron los griegos es sólo la instancia en dimensión 3 
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de la familia de espacios euclidianos E”; pero además la pluralización (pasar de uno 
a muchos) se da en otro sentido. En matemáticas, y en particular en la geometría, 
surgen naturalmente otros conjuntos, además de los JE”, con plenos derechos de ser 
llamados “espacios”; en la física se les llama “espacios fase”. Los dos “espacios”? que 
nos ocupan ahora son los de rectas en el plano. Consideraremos cada recta como 
un punto de un nuevo “espacio” y, puesto que intuitivamente podemos decir si dos 
rectas son cercanas o no, en este nuevo “espacio”, sabremos si dos puntos lo están. 
La idea clave está en que así como Descartes asoció parejas de números a los puntos 
del plano, a las rectas del plano también hemos asociado números (los involucrados 
en sus ecuaciones) de tal manera que si esos números varían un poco la recta asociada 
también se mueve poco; dan lugar a una noción de “continuidad” que es la noción 


básica de la topología. 


En el Ejercicio 1.68 de la sección 1.8, se hizo notar que a cada terna de números 
(a,b,c) € RY, con (a,b) 4 (0,0), se le puede asociar una recta en R?, a saber, la 
definida por la ecuación ax + by = c; el estudiante debió haber demostrado que las 
rectas por el origen en R* dan la misma recta en R? y que los planos por el origen en 
R* corresponden a los haces de rectas en el plano. Dando esto por entendido, en esta 
última sección abundaremos en tales ideas. Se puede decir que la pregunta que nos 
guía es: ¿cuántas rectas hay en R??, pero el término “cuántas” es demasiado impre- 
ciso. Veremos que las rectas de R? forman algo que llamaremos el “espacio” de rectas 
(un caso especial de las llamadas “Grassmannianas” pues quien primero desarrollo 
estas ideas fue Grassmann), y para esto les daremos “coordenadas” explícitas, muy a 
semejanza de las coordenadas polares para los puntos. 


1.12.1 Rectas orientadas 


Consideremos primero las rectas orientadas en R?, pues a ellas se les puede asociar un 
vector normal (y por tanto una ecuación) de manera canónica. Una recta orientada 
es una recta L junto con una orientación preferida, que nos 
dice la manera positiva de viajar en ella. Entonces, de todos 
sus vectores direccionales podemos escoger el unitario d con 
la orientación positiva y, como vector normal, escogemos el 
compadre ortogonal de éste; es decir, el vector unitario tal 
que después de la orientación de la recta nos da la orientación 
positiva del plano. Así, cada recta orientada está definida por 
una ecuación unitaria Única 


7 U-x=C, 


Mantenemos las comillas pues la noción aún no está bien definida: va en la dirección de lo que 
ahora se llama topología. 
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donde u € S!, y c ER es su distancia orientada al origen. 


Nótese que a cada recta orientada se le puede asociar su semiplano positivo U-x > 


c; así que fambién 


L Maa Los haces de líneas orientadas paralelas corresponden a 


podemos pensar a las rectas orientadas como semiplanos. 
Puesto que esta ecuación unitaria es única (por la 
orientación) entonces hay tantas rectas orientadas como 
parejas 


(u,c) eS xRER?xR=R? 


y) 


e y este conjunto es claramente un cilindro vértical en R?. 


líneas verticales en el cilindro, pues en estos haces el vec- 
tor normal está fijo. Y los haces de líneas (orientadas) 
concurrentes corresponden a lo que corta un plano por 
el origen al cilindro S' x R (que, como veremos en el 
capítulo siguiente, se llama elípse). 


EJERCICIO 1.106 Demuestra la última afirmación. 


1.12.2 Rectas no orientadas 


Las dos orientaciones de una recta l tienen ecuaciones unitarias Uu-x =cC y (—u) -x = 
—cC. Si la recta no pasa por el origen (si O £ l y por tanto c % 0), de estas dos 


ecuaciones unitarias podemos tomar la ecuación con constante 
estrictamente positiva, U-x = p, con p > 0, digamos. Así que 
las “coordenadas” (u, p) corresponden a las coordenadas polares 
del punto en la recta £ más cercano al origen; y viceversa, a cada 
punto x € R? —(0) se le asocia la recta que pasa por el punto x 
y es normal al vector x. O dicho de otra manera, si la recta l no 
contiene al origen, podemos 

escoger el semiplano que de- 


fine que no contiene a 0. Nos queda una am- 


bigiiedad en el origen: para las rectas que pasan <A 


por él tenemos dos vectores unitarios normales 
que definen la misma recta. Podemos resumir 


que las rectas en 


R? corresponden a los puntos QT 


de un cilindro “semicerrado” 


(donde Ry = lp € 


SIxRy, 


R | p > 05), donde hay que identificar su frontera por antípodas, 


es decir, en este conjunto (u, 0) y (—u, 0) aún representan la misma recta. Si identi- 


ficamos (u, 0) con 
abierta. Veámos: 


(—u, 0) en el cilindro S' x R,, se obtiene una banda de Moebius 
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Hay que pensar que el cilindro S! x Ry está hecho de un material 
flexible (pensarlo como “espacio topológico”, se dice actualmente), y hacer 
muy pequeño el factor R,, para tener un cilindrito con una de sus fronteras 
inexistente (la que corresponde al infinito), indicada en las figuras con línea 
punteada. En la otra frontera (que corresponde al 0) debemos pegar puntos 
antípodas. Llamemos a al segmento dirigido que es la mitad de ese círculo 


y entonces la otra mitad, con la misma orientación del círculo, vuelve a ser a. 


Si tratamos de pegar directamente los segmentos 

a, la superficie del cilindro nos estorba y no se ve qué 
pasa con claridad (de hecho no se puede lograr en IR* 
sin que la superficie se autointersecte). Conviene en- 
tonces cortar el cilindro por los segmentos verticales, 
denotados con b y c en la figura, sobre el princi- 
pio y fin de a, para obtener dos pequeños cuadra- 
5 dos (que hemos ba- 

utizado 1 y 2). Los 
segmentos b y c es- 
tán dirigidos y debe- 
mos recordar que hay que volverlos a pegar cuando 


se pueda. 


Ahora sí podemos pegar los segmentos a recordando 
su dirección. Basta voltear el cuadrado 2 de cabeza para 
lograrlo, y obtener un rectángulo. Si alargamos el rec- 
tángulo en su dirección horizontal, obtenemos una banda 
en la cual hay que identificar las fronteras verticales he- 
chas, cada una, con los pares de segmentos b y c (la 
frontera horizontal sigue siendo punteada). Y esta iden- 
tificación, según indi- 
can nuestros segmen- 
tos dirigidos, es invir- 
tiendo la orientación; 
hay que dar media vuelta 
para pegarlos, así que el resultado es una banda 
de Moebius a la que se le quita su frontera, y ya 
no queda nada por identificar. 
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Hemos demostrado que las rectas del plano corresponden biyec- 
tivamente a los puntos de una banda de Moebius abierta, y que esta 
correspondencia preserva “cercanía” o “continuidad”. 

Obsérvese además que las rectas que pasan por el origen (el seg- 
mento a con sus extremos identificados) quedan en el “corazón” (el 
círculo central) de la banda de Moebius; los haces paralelos corre- 
sponden a los intervalos abiertos transversales al corazón que van 
de la frontera a sí misma (el punto de intersección con el corazón 
es su representante en el origen). ¿A qué corresponden los haces 

concurrentes? 


EJERCICIO 1.107 Demuestra que dos haces de rectas, no ambos haces paralelos, tienen 
una única recta en comun. 
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CAPÍTULO 1. EL PLANO EUCLIDIANO 


Capítulo 2 


Cónicas 1 (presentación) 


Las cónicas son una familia de curvas famosas que definieron los griegos. De ellas, la 
que vemos cientos de veces al día es la elipse. Al ver la boca de un vaso, una taza O 
una vasija, o bien, la llanta de un coche, vemos una elipse e inmediatamente intuimos 
que en realidad se trata de un círculo, sólo que lo estamos viendo de lado. Únicamente 
vemos un círculo cuando la proyección ortogonal de nuestro ojo al plano en el que 
vive el círculo es justo su centro; así que los cientos de círculos que vemos a diario 
son nuestra deducción cerebral automática de las elipses que en realidad percibimos. 
Para fijar ideas, pensemos que vemos con un solo ojo una taza sobre una mesa; cada 
punto de su borde define una recta a nuestro ojo por donde 
viaja la luz que percibimos; todas estas rectas forman un cono 
con ápice xen el punto ideal de nuestro ojo; pero no es un cono 
circular sino un cono elíptico: más apachurrado entre más cerca 
esté nuestro ojo al plano de la boca de la taza, y más circular 
en cuanto nuestro ojo se acerca a verlo desde arriba. Resulta 
entonces que si a este cono elíptico lo cortamos con el plano de 
la boca de la taza nos da un círculo (precisamente, la boca de 
la taza). Los griegos intuyeron entonces que, al revés, la elipse 
se puede definir cortando conos circulares (definidos con base 
en el círculo que ya conocían) con planos inclinados. 


Hoy día lo podemos decir de otra manera: si prendemos una lámpara de mano, 
de ella emana un cono circular de luz; es decir, si la apuntamos ortogonalmente a una 
pared se ilumina un círculo (con todo y su interior); al girar un poco la lámpara, el 
círculo se deforma en una elipse que es un plano (la pared) que corta un cono circular 
(el haz de luz). Entre más inclinada esté la lámpara respecto a la pared, la elipse se 
alarga (como boca de taza con el ojo casi al ras) hasta que algo de la luz sale de la 
pared. Pensemos entonces que la pared es infinita (un plano) y que nuestra lámpara 
es infinitamente potente (un cono perfecto); al girar más la lámpara, la elipse se sigue 
alargando y alargando hasta el momento en que uno de los rayos del cono no toca la 
pared (es paralelo a ella). Justo en ese instante, el borde de lo iluminado en la pared es 


jál 
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una parábola, y de allí en adelante, al continuar el giro, es una rama de hipérbola. La 
hipérbola completa se obtiene al pensar que los rayos del cono son rectas completas, 
que se continúan hacia atrás de la lámpara, y entonces algunas de estas rectas (cuyos 
rayos de luz ya no tocan la pared por adelante) la intersectan por atrás en la otra 
rama de la hipérbola. Si continuamos el giro, pasamos de nuevo por una parábola 
y luego por elipses que, viniendo de atrás, se redondean hasta el círculo con el que 
empezamos, pero ahora dibujado por el haz de rayos “hacia atrás” de la lámpara que 
giró 180%. La definición clásica de los griegos, que es equivalente, es fijando el cono y 
moviendo el plano, y de allí que las hayan llamado secciones cónicas o simplemente 
cónicas: la intersección de planos con conos circulares (completos). 


Los geómetras griegos estudiaron con profundidad estas curvas. Lo hicieron por 
amor al arte, al conocimiento abstracto y puro, por la intuición matemática de su 
propia belleza y naturalidad; y dieron a la humanidad una lección fundamental de 
la importancia que tiene la ciencia básica. Pues resultó, casi dos mil años después, 
que estas curvas teóricas se expresaban en la naturaleza como las órbitas de los plan- 
etas (elipses descritas por Kepler) o en las trayectorias de los proyectiles (parábolas 
descritas por Newton y predecesores). Sus propiedades focales, que también des- 
cubrieron los griegos, se usan hoy cotidianamente en las antenas parabólicas, en los 
telescopios y en el diseño de reflectores o de las lentes de anteojos o cámaras. Su 
teoría, que parecía ser un divertimento totalmente abstracto, resultó importantísima, 
en la vida diaria y en el entendimiento de la naturaleza. 


Los geómetras griegos demostraron que a las cónicas también se les puede definir 
intrínsecamente como lugares geométricos en el plano, es decir, como subconjuntos 
de puntos que cumplen cierta propiedad; a saber, una propiedad que se expresa en 
términos de distancias. Ésta será la definición formal que usaremos en el libro y 
en la última sección de este capítulo veremos que coincide con la de secciones cóni- 
cas. En las primeras secciones veremos que su definición como lugares geométricos 
expresados en términos de distancias es equivalente a su descripción como el lugar 
geométrico de puntos en R? cuyas coordenadas satisfacen cierta ecuación. Resulta 
que estas ecuaciones son ecuaciones cuadráticas en dos variables, x y y (las coorde- 
nadas). Este hecho, que observó el propio Descartes, fue una gran motivación para el 
surgimiento de su geometría analítica, pues relacionaba las clásicas secciones cónicas 
con los polinomios de segundo grado, y en general el álgebra, que habían desarrollado 
los árabes. 


2.1 Círculos 


Ya hemos definido y usado extensamente el círculo unitario S!, determinado por la 
ecuación 
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Consideremos ahora cualquier otro círculo C. Tiene un centro p = (h,k), un radio 
Tr >0, y es el lugar geométrico de los puntos cuya distancia a p es Tr. Es decir, 
f= fx e R?|d(x,p) = r); o bien, C está definido por la ecuación 


d(x,p)=. e e 


Puesto que ambos lados de esta ecuación son positivos, es equiva- 
lente a la igualdad de sus cuadrados que en coordenadas toma la 
forma 

(x—H)? + (y =k)* =73. 


De tal manera que todos los círculos de R? están determinados por una ecuación 
cuadrática en las variables x y y. Cuando la ecuación tiene la forma anterior, podemos 
“leer” toda la información geométrica (el centro y el radio). Pero en general viene 
disfrazada como 

x?+y?—2hx—2ky = (1? —h?*—k?) 


que es, claramente, su expresión desarrollada. Veamos un ejemplo. 
Consideremos la ecuación 


2 +y?—6x+2y =-6. (2.3) 


Para ver si define un círculo, y cuál, hay que tratar de escribirla en la forma (2.2). Para 
esto hay que “completar” los cuadrados sumando (en ambos lados) las constantes que 
faltan 


(24—6+9)+(u1+2y+1) = -6+9+1 
x-3+(y+D? = 4 


Es claro que al desarrollar esta ecuación obtenemos la original, de tal manera que 
aquélla define el círculo con centro en (3, —1) y radio 2. 

También podemos expresar la ecuación de un círculo de manera vectorial, pues el 
círculo C con centro p y radio r está claramente definido por la ecuación 


(x—p) - (xp) =r, (2.4) 


que es el cuadrado de (2.1). Esta ecuación, que llamaremos la ecuación vectorial del 
círculo, se puede también reescribir como 


x-x—2p-x+p-p=r?. 


Parece superfluo pero tiene grandes ventajas. Por ejemplo, en algunos de los 
ejercicios siguientes puede ayudar, pero además, y mucho más profundo, al no hacer 
referencia a las coordenadas tiene sentido en cualquier dimensión. Sirve entonces para 
definir esferas en R* y, como veremos en la siguiente sección (en la que vale la pena 
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que el estudiante tenga en mente cómo traducir a IR*, esferas y planos), de la ecuación 
vectorial se puede extraer mucha información geométrica interesante. 


teoría. 


Debemos también remarcar que en las siguientes secciones, donde empezamos a 
estudiar las otras cónicas, no aparece el equivalente de esta ecuación vectorial del 
círculo. Para lograrlo en general (en el capítulo 9) nos falta desarrollar mucha más 


EJERCICIO 2.1 ¿Cuáles de las siguientes ecuaciones son ecuaciones de un círculo? Y 
en su caso, ¿de cuál? 


a) x? —6x +y?-—4y = 12 
b) x?+4x+4?+2y=11 
c) 2x? + 8x + 2y? —4y =-8 
d) x* —4x+y?=2y =-6 
e) 4x2? +4x + y? —2y =4. 


EJERCICIO 2.2 ¿Cuál es el lugar geométrico de los centros de los círculos que pasan 
por dos puntos (distintos) a y b? 


EJERCICIO 2.3 Sean a y b dos puntos (distintos) en el plano; y sean Cy el círculo 
con centro A y radio 11 y C el círculo con centro b y radio r3. Demuestra que Cj] y 
Cz son tangentes (i.e. se intersectan en un único punto) si y sólo si r¡ +12 = d(a,b) o 
Tr, +d(a,b) = r2 o r2+d(a,b) = r¡. ¿A qué corresponden geométricamente las tres 


condiciones anteriores? Haz un dibujo de cada caso. 


EJERCICIO 2.4 Dados los círculos del ejercicio anterior, da condiciones sobre sus radios 


y la distancia entre sus centros para que: 

a) el círculo C¡ esté contenido en el interior del círculo C2; 

b) el círculo Cy esté contenido en el exterior del círculo C2 (y viceversa); 
c) el círculo C1 y el círculo C2 se intersecten en dos puntos. 


EJERCICIO 2.5 Demuestra que por tres puntos no colineales a,b y € pasa un único 


círculo, llamado el circuncírculo del triángulo a,b,c. 


EJERCICIO 2.6 Demuestra que dadas tres líneas no concurrentes y no paralelas dos 
a dos existen exactamente cuatro círculos tangentes a las tres; al que está contenido en el 
interior del triángulo se le llama su incírculo. 


EJERCICIO 2.7 Sean p y q dos puntos distintos en el plano (o en R2). 
Demuestra que el conjunto de puntos x cuyas líneas a p y a q son ortogonales, 
es un círculo (o una esfera) que “quiere contener” a p y a q. Más precisamente, 
que el conjunto definido por la ecuación 


(x—p) - (x-q)=0 


es el círculo con el segmento Pq como diametro. (Compara esto con el ejercicio siguiente). 
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EJERCICIO 2.8 Sean p y q dos puntos distintos en el plano. ¿Para cuáles números 
reales c se tiene que la ecuación 
(x—p) - (x-q)=c 


define un círculo? En su caso, ¿cuál es el radio y dónde está su centro? 


2.1.1 Tangentes y polares 


Observemos primero que las líneas tangentes a un círculo son las normales a los radios 
(los segmentos del centro a sus puntos). Efectivamente, si A es un punto del círculo 
C dado por la ecuación vectorial 


(x—p) - (x-p) =1, (2.4) 


entonces su tangente es la recta l normal a (A— p) y que pasa 
por A. Pues a es el punto más cercano a p en esta recta, de 
tal manera que para cualquier otro punto x E fl se tiene que 
d (x,p) > r. Como el círculo C parte el plano en dos pedazos (el 
interior donde d(x,p) < r, y el exterior donde d(x,p) > 1 ), 
entonces l está contenida en el exterior salvo por el punto a € C; 
ésta será nuestra definición de tangente. 
Claramente, la recta l está dada por la ecuación 


x-(a—-p)=a-(a—p), 


que tiene una manera mucho más interesante de escribirse. Restando p - (a—p) a 
ambos lados se obtiene 


x-(a—p)-p-*(a—p) = a-(a—p)-—p-(a—p) 
(x-p)-(a—p) = (a—p)-(a—p) 
(xp) - (a— ? 


p) = Tr, 
pues a € C. La ecuación de la tangente se obtiene entonces al sustituir el punto en 
una de las dos apariciones de la variable x en la ecuación vectorial (2.4). 

Para cualquier otro punto en el plano, A digamos, que no sea el centro (a 4 p), el 
mismo proceso algebraico —sustituir A en una de las instancias de x en la ecuación 
vectorial— nos da la ecuación de una recta, llamada la polar de A respecto al círculo 
C, y que denotaremos f,; es decir, 


sea la: (x—p)-(a—-p)=7. (2.5) 


Ya hemos visto que cuando a € C, su polar fl, es su tangente. Ahora veremos 
que si A está en el interior del círculo, entonces la no lo intersecta (está totalmente 
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contenida en el exterior), y que si está en el exterior (el punto b en la figura siguiente), 
entonces lo corta, y además lo corta en los dos puntos de C a los cuales se pueden 
trazar tangentes. 


Para esto, expresemos la ecuación de fl, en su forma 

normal; desarrollando (2.5) se obtiene: 
x-(a—-p)=r?+p-(a—p). 

Esto indica que l¿ es perpendicular al vector que va de 
pa a. Ahora veamos cuál es su punto de intersección 
con la recta que pasa por p y A. Parametricemos esta 
última recta con p de cero y A de uno (es decir como 
p+t(a—p)) y podemos despejar t al sustituir en la 
variable x de la ecuación anterior (o bien, esto se ve más 
directo al sustituir en la (2.5)), para obtener 


y? y? 


(a—p)-(a—p)  d(p,a)? 
Entonces la distancia de p a l, es 


2 
d(p,la) =td (p, a) = se a (a 3) (2.6) 


y tenemos lo primero que queríamos: si d (p, a) < r entonces d (p,la) > r; y al revés, 
si d(p, a) > r entonces d (p,la) < r. Si el punto Aa está muy cerca de p, su polar 
está muy lejos, y al revés, sus distancias al centro p se comportan como inversos pero 
“alrededor de r” (si r = 1 son precisamente inversos). 

Supongamos ahora que d (p, a) > r, y sea e un punto en l¿NC (que sabemos que 
existe pues la pasa por el interior de C). Puesto que € € la, 
se cumple la ecuación 


2 
(c—p)-(a—p) =1". 
Pero entonces a cumple la ecuación de €. que es la tangente 
a C en C; es decir, la línea de A a € es tangente al círculo. 
Nótese que el argumento anterior es mucho más general: 


demuestra que para cualesquiera dos puntos a y b (distintos 
de p) se tiene que 


act obels. (2.7) 


Y los puntos del círculo son los únicos para los cuales se cumple A € fla. 

En particular, hemos aprendido a calcular los puntos de tangencia a un círculo 
desde un punto exterior A. A saber, de la ecuación lineal de su polar, la, se despeja 
alguna de las dos variables y se sustituye en la ecuación del círculo. Esto nos da una 
ecuación de segundo grado en la otra variable que se puede resolver, y nos da dos 
raíces. Sustituyéndolas de nuevo en la ecuación de la polar se obtiene el otro par de 
coordenadas. 
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Por ejemplo, la ecuación del círculo (2.3) tiene la expresión vectorial 
((x, y) — (3, —1)) - U(x, y) — (3, —1)) =4. 


Si queremos conocer los puntos de tangencia desde el punto a = (1,3), encontramos 
primero la ecuación de su línea polar: 


(6 y) -(8,—1) (11,3) (65, —1)) =4 
(x-3,y +1) - (-2,4) = 
—=2x+4y+10=4 

x—2y=3. 


De aquí, para encontrar l¿ NC, conviene sustituir x = 3 + 2y en 
la ecuación original del círculo (2.3) para obtener 


(3+2y?+y?-6(3+2y)+2y = -6 
5y? + 2y — 3 


| 
e 


Las raíces de esta ecuación cuadrática se obtienen por la fórmula clásiga qué los 
0) 


estudiantes de la ciudad de México llaman “del chicharronero” :! 


A a 
y= 10 == > 


que nos da los valores yy = —1 y y1 = 3/5. Y estos, al sustituir de nuevo en la ecuación 
de la polar nos dan los puntos de tangencia de a; que son (1,—1) y (1/5) (21,3). El 
estudiante puede verificar que satisfacen la ecuación del círculo, aunque los hayamos 
obtenido (al final) sustituyendo en la ecuación lineal de la polar, y que efectivamente 
sus tangentes pasan por a. 


EJERCICIO 2.9 Encuentra los puntos de tangencia: 
a) al círculo x? —2x + y? —4y =-3 desde el punto (—1,2); 
b) al círculo x? + y? = 1 desde el punto (2,2). 


EJERCICIO 2.10 Sea o una secante de un círculo C, es 
decir un segmento con extremos en el círculo. Si trazamos las 
tangentes por sus extremos, éstas se intersectan en un punto, 
que llamaremos el polar de O. Demuestra que tres secantes 
son concurrentes si y sólo si sus puntos polares son colineales. 


El polinomio ax? + bx + c tiene como raíces a (—b+ Vb? — 4ac)/2a. 
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EJERCICIO 2.11 El estudiante que en el ejercicio anterior observó la necesidad formal 
de eliminar los diámetros en la definición de punto polar de un segmento, hizo muy bien; 
pero el que no se puso quisquilloso, y ni cuenta se dio, hizo mejor. Pensó proyectivamente. 
Demuestra que si permitimos que el centro p entre a nuestras consideraciones anteriores 
y añadimos puntos “polares” a los diámetros que juntos forman la nueva línea lp polar 
con p, entonces la polaridad se extiende a todas las líneas (falta definirla en las tangentes 
y exteriores) y que es una biyección entre líneas y puntos que cambia concurrencia por 
colinearidad. Observa además que los nuevos puntos (polares de los diámetros) tienen una 
dirección (no orientada) bien definida, aquella en la que se alejan los puntos polares de una 
secante que se acerca al diámetro correspondiente. 


EJERCICIO 2.12 Demuestra que si € es un punto exterior (al círculo C con centro p) 
entonces su recta a p bisecta sus dos tangentes a C. Y además que las distancias a sus pies 
en C (es decir, a los puntos de tangencia) son iguales. 


EJERCICIO 2.13 Observa que toda nuestra discusión sobre líneas polares se basó en 
la ecuación vectorial (2.4) que tiene sentido en RW donde define esferas. Define la noción 
de plano polar a un punto respecto de una esfera en R%. Demuestra que un punto c en el 
exterior tiene como plano polar a uno que intersecta a la esfera en un círculo formado por 
los puntos de la esfera cuyas líneas a e son tangentes (a la unión de estas líneas se le llama 
el cono de la esfera con ápice C). 


2.2 Elipses 


Si amarramos un burro hambriento a una estaca en un prado, se irá comiendo el 
pasto deambulando al azar, pero terminará por dejar pelón el interior de un círculo 
(con centro la estaca y radio la longitud del mecate). Si amarramos los extremos del 
mecate a dos estacas y le engarzamos al burro, lo que dibujará es una elipse; por 
eso, a fijar dos tachuelas en un papel, amarrar holgadamente un hilo entre ellas y 
luego tensar con un lápiz y girarlo, se le conoce como “el método del jardinero” para 
trazar elipses. Formalmente, las elipses son el lugar geométrico 
Xx de los puntos (posiciones de la boca del burro cuando tensa el 
mecate) cuya suma de distancias a dos puntos fijos llamados focos 
(las estacas) es constante (la longitud del mecate). De tal manera 
que una elipse € queda determinada por la ecuación 


d(x,p) +d(x, q) = 2a, (2.8) 


dé p y q son los focos y a es una constante positiva, llamada semieje mayor, tal 
que 2a > d (p, q). 

Incluimos el coeficiente 2 en la constante para que quede claro que si los focos 
coinciden, p = q; entonces se obtiene un círculo de radio a y centro en el foco; así 
que los círculos son elipses muy especiales. Esta ecuación, poniéndole coordenadas a 


2.2. ELIPSES TO 


los focos, incluye raíces cuadradas por las distancias, y es aún muy “fea”. Veremos 

ahora que en un caso especial es equivalente a una ecuación cuadrática “bonita”. 
Supongamos que el centro de la elipse €, 1.e., el punto medio entre los focos, está 

en el origen y que además los focos están en el eje x. Entonces tenemos que p = (c, 0) 

y q = (-c,0) para alguna c tal que 0 < e < a (donde ya suponemos que la elipse 

no es un círculo al pedir 0 < c). Es fácil ver entonces que 
la intersección de € con el eje x consiste en los puntos (a, 0) A 
y (—a,0), pues la ecuación (2.8) para puntos (x, 0) es 


pe=0l+|2+el= 


que sólo tiene las soluciones x = a y x = —a (véase el 
Ejercicio 2.15), y de aquí el nombre de semieje mayor para 
la constante a. Como el eje y es ahora la mediatriz de los 
focos, en él, es decir en los puntos (0, y), la ecuación (2.8) 


se vuelve 
/ 0? + y? == 


que tiene soluciones y = +b, donde b > 0, llamado el semieje menor de la elipse €, 
es tal que 


P=d=«. 


Ahora sí, consideremos la ecuación (2.8), que con x = (x,y) y la definición de 
nuestros focos, se expresa, 


VO + y2+4/ (+0) +y? =2a. (2.9) 


Si elevamos al cuadrado directamente esta ecuación, en el lado izquierdo nos quedaría 
un incómodo término con raíces. Así que conviene pasar una de las dos raíces al otro 


lado, para obtener 
yo +y =20— y (x +0) 


Al elevar al cuadrado, se tiene 


x? —2cx + e? =4a? —4a +2 +e 


4aa/ (x +)? + y? =4a? + 4cx 
ay (x+0)+y?= a +ex 


(x— e)? + y? =4a? —4a4/ (x (x+0) 
ol 
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Elevando de nuevo al cuadrado, nos deshacemos de la raíz, y después, al agrupar 
términos, obtenemos 


a? (0 +0 + y?) = a+ 2a?cx + cx (2.11) 
alx? + 2a2cex+ ac? + alty? = at+2a?cx + tx? 
(a? e?) e+ay = q (a? e?) 
bx + ay? = ab? 


ue, al dividir entre a?b?, se escribe finalmente como 
) ) 


xy 
ay 


(2.12) 
llamada la ecuación canónica de la elipse. 

Hemos demostrado que si x = (x,y) satisface (2.8), entonces satisface (2.12). 
Lo inverso, aunque también es cierto, no es tan automático, y requiere más argu- 
mentación pues en dos ocaciones (al pasar a las ecuaciones (2.10) y (2.11)) elevamos 
al cuadrado. Es cierto que si dos números son iguales entonces también sus cuadrados 
lo son (que fue lo que usamos); pero si r? = t? no necesariamente se tiene que T = t, 
pues podría ser que r =—t. Éste es el problema conceptual conocido como “la raíz 
cuadrada tiene dos ramas”, entonces los pasos de las ecuaciones (2.10) y (2.11) hacia 
arriba requieren argumentación sobre los signos (todos los demás pasos hacia arriba 
sí son automáticos). A manera de verificación, demostremos el inverso directamente. 

Supongamos que x = (x,y) satisface la ecuación canónica de la elipse (2.12); 
veremos que entonces satisface la ecuación (2.9). Como en (2.12) se tiene una suma 
de números positivos que dan 1, entonces ambos sumandos están entre 0 y 1. Por lo 
tanto |x| < la] = a, y esto habrá que usarse al sacar una raíz. De la ecuación (2.12) se 
puede despejar y? y sustituirla en las expresiones dentro de las raíces de (2.9), para 
obtener, en la primera, 

2 


(x= +y? = o y 


b? 
( a) e 


AN 
6 a ) e 200 + (0? +1) 


a 
2 


Cc c 2 
=Sx —2ex + a? = (Exa) y 
a a 


Ahora bien, como [|x| < lal = a implica que x < a, y además 0 < ce < a, entonces 
ex < a? y por tanto Ex < a. Así que la expresión que pusimos arriba es negativa y 
entonces la raíz es la otra posible rama; es decir, hemos demostrado que 


Mio ya Ex 
a 
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De manera análoga, pero usando ahora que —x < a, se demuestra que 


y0+o +y=a+=x, 


de donde se sigue la ecuación de las distancias (2.9). 


EJERCICIO 2.14 Dibuja algunas elipses usando el método del jardinero. ¿Verdad que 
no salen de un solo trazo? 

EJERCICIO 2.15 Sea c > 0. Dibuja la gráfica de la función f : R — R definida por 
f(x) = lx — cl + |x + el. Concluye que si a > c entonces f(x) = 2a si y sólo si |x|] = a. 


EJERCICIO 2.16 Sean C; y C2 dos círculos con centros A y b respec- 
tivamente, tales que C7 está contenido en el interior de C¡. Demuestra 
que el conjunto de puntos que son centro de un círculo (3 tangente tanto 
a Cy como a C2 es un par de elipses con focos A y b. Observa que en el 
caso límite en que C¡ es tangente a C2, una de las elipses se degenera en 
un segmento. 


2.3 Hipérbolas 


La hipérbola está definida como el lugar geométrico de los puntos cuya diferencia (en 
valor absoluto) de sus distancias a dos puntos fijos p y q, llamados 
focos, es constante. Entonces, una hipérbola H está definida por 
la ecuación 


ld (x,p) — d (x, q) =2a, (2.13) 


donde a > 0, y además 2a < d(p, q) =: 2c (véase el Ejercicio 
2.17). Si tomamos como focos a p = 
(c,0) y q = [—c, 0), esta ecuación toma 


A la forma 
" (x— 0)? + y? y/ («4 e)? + y?| =2a. (2.14) 
3 =P 
a Veremos a continuación que es equivalente a 
x2 y? 


donde b > 0 está definida por a? + b? = c?. A esta última ecuación se le llama la 
ecuación canónica de la hipérbola. 
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Como las dos primeras ecuaciones involucran valores absolutos, entonces tienen 
dos posibilidades que corresponden a las dos ramas de la hipérbola. En una de ellas 
la distancia a uno de los focos es mayor y en la otra se invierten los papeles. De la 
ecuación (2.14) se tienen dos posibilidades: 


(x— 0 +y2=2a+4/(x+ 0) +42 


(2.16) 
¿eto + y? =2a + 4/(x— 0)? + y?; 


la primera corresponde a la rama donde x < 0 y la segunda a x > 0. Como se hizo 
en el caso de la elipse (elevando al cuadrado, simplificando para aislar la raíz que 
queda y luego volviendo a elevar al cuadrado y simplificando, véase Ejercicio 2.18) se 
obtiene, de cualquiera de las dos ecuaciones anteriores, la ecuación 


(a? —c%) x* + aty? = a? (ad—c”). (2.17) 


Y de aquí, al sustituir —b? = a? — e?, y dividir entre —a?b? se obtiene la ecuación 
canónica. 


EJERCICIO 2.17 Demuestra que la ecuación (2.13) define la mediatriz de p y q para 
a = 0; los rayos complementarios del segmento PA para a = Cc, y el conjunto vacío para 
a>Cc. 

EJERCICIO 2.18 Demuestra que la ecuación (2.17) se sigue de cualquiera de las dos 
anteriores (2.16). 


EJERCICIO 2.19 Demuestra que si (x, y) satisface la ecuación (2.15) entonces |x| > a. 
Concluye (sustituyendo en las raíces, como en el caso de la elipse) que, entonces, alguna de 
las dos ecuaciones (2.16) se satisfacen. 


EJERCICIO 2.20 Sean C1 y C2 dos círculos con centros a y b 
respectivamente, y sea Y el conjunto de los puntos que son centro de 
un círculo (3 tangente tanto a Cy como a C). 

NN a) Demuestra que si C¡ y C2 están fuera uno del otro y sus radios son 
distintos, entonces Y consta de un par de hipérbolas con focos A y 
b. 

b) Demuestra que si (1 y C2 se intersectan pero no son tangentes y sus 
radios son distintos, entonces Y consta de un hipérbola y una elipse 
con focos a y b. 

c) Discute los casos límite entre los casos anteriores y el del Ejercicio 
2.16 y el de radios iguales. 


2.4 Parábolas 


Una parábola es el lugar geométrico de los puntos que equidistan de un punto p 
(llamado su foco) y una recta l, llamada su directriz, donde p £ l. Es decir, está 
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definida por la ecuación 
d (x,p) = d (x,1). 


Tomemos un ejemplo sencillo con el foco en el eje y, la directriz paralela al eje x, y 
que además pase por el origen. Tenemos entonces p = (0, c), donde c > 0 digamos, 
y l:y =-—<; de tal manera que la parábola queda determinada por la ecuación 


ya +![y=e)* = y+el. 


Como ambos lados de la ecuación son positivos, ésta es equivalente a la igualdad de 
sus cuadrados que da, 


tt —Dey+é y? + 2cy + e? 
2 


x= ey, 


De tal manera que la gráfica de la función x? (y = x?) es una parábola con foco 
(0,1/4) y directriz y = —1/4. Veremos ahora que cualquier parábola cumple “la 
propiedad de ser gráfica de una función” respecto de su directriz. 

Sea P la parábola con foco p y directriz l (donde p £ £). Dado un punto Yo € l, 
es claro que los puntos del plano cuya distancia a l coincide con (o se mide por) su 
distancia a Yo son precisamente los de la normal a l que pasa por Yo, llamémosla vo. 
Por otro lado, la mediatriz entre Yo y Pp, llamémosla n,, consta de los puntos cuyas 
distancias a p y a Yo coinciden. Por lo tanto la intersección 
de No y Vo está en la parábola P, es decir, Xy = Vo NMy E P, 
pues d(Xo,2) = d(xo,Yo) = d(Xxo,p). Pero además Xy es 
el único punto en la normal vy que está en P. Ésta es “la 
propiedad de la gráfica” a la que nos referíamos. 

Podemos concluir aún más: que la mediatriz n, es la tan- 
gente a P en Xy. Pues para cualquier otro punto X € Ty, se 
tiene que su distancia a l es menor que su distancia a Yo que 
es su distancia a p (d(x,£) < d(x,yYo) = d(x,p)), y en- 
tonces x 4 P. De hecho, la parábola P parte el plano en dos 
pedazos, los puntos más cerca de p que de £ (lo de adentro, 
digamos, definido por la desigualdad d (x,p) < d (x,£)) y los 
que están más cerca de l que de p (lo de afuera, dado por d (x,2) < d (x, p) en donde 
está 1, ), que comparten la frontera donde estas distancias coinciden (la parábola P). 
Así que 1], pasa tangente a P en Xo, pues Xy € Ny NP y además 1] se queda de un 
lado de P. 


2.5 Propiedades focales 


2.5.1 De la parábola 
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Del análisis geométrico anterior es fácil deducir la propiedad 
focal de la parábola que la ha hecho tan importante en la tec- 
nología de los siglos recientes, pero que se conoce desde que 
Apolonio de Pergas (c. 255-170 A.C.) escribió “Sobre las cóni- 


Como la mediatriz 1], es bisectriz del ángulo px.Yo, que 
llamaremos 20, entonces un fotón (partícula de luz) que viaja 
por Vo (la normal a £) hacia l y “dentro” de la parábola incide 
en ella con ángulo a (este ángulo se mide infinitesimalmente, 
VA es decir, con la tangente ny); como el ángulo de incidencia es 
igual al de reflexión, entonces rebota en el rayo que va directo 
al foco p. 

Llamemos eje de la parábola a la perpendicular a la directriz que pasa por el 
foco. Se tiene entonces que un haz de fotones que viaja en rayos paralelos al eje se va 
reflejando en la parábola para convertirse en un haz que converge en el foco p. 

Una antena parabólica casera (que se obtiene girando en su eje a una parábola) 
apuntada a un satélite, refleja entonces la onda de radio que viene de éste (el satélite 
está tan lejos que esta onda ya “es” paralela) y la hace converger en el receptor 
(puesto en el foco): “medio metro” cuadrado de la onda se concentra simultáneo en 
el receptor puntual; tal amplificación hace fácil captarla. El proceso inverso se usa en 
lámparas o en antenas transmisoras, y reflejan un haz que emana del foco en un haz 
paralelo al eje. 


2.5.2 De la hipérbola 


¿Qué pasa si plateamos (hacemos espejo) el otro lado de la parábola? Es fácil ver 
que entonces el haz paralelo al eje que incide en ella (por fuera) se refleja en un haz 
que emana (o simula emanar) del foco. Si pensamos que un haz paralelo viene de 
un punto al infinito y queremos reproducir este fenómeno para un haz puntual (que 
emana de un punto) hay que usar la hipérbola. 

Sea H una hipérbola con focos p y q; el haz que emana del foco p se refleja en la 
rama de H cercana a q, en un haz que emana de q. Entonces el uso tecnológico de 
la hipérbola es con refracción: si el fotón cruza la hipérbola con ángulo de incidencia 
igual al de refracción, entonces el haz que emana de p se refracta en uno confluyente 
en q (algo así se usa en el diseño de las lentes). Demostrar esto equivale a demostrar 
que la tangente a la hipérbola H en un punto X es bisectriz de sus líneas a los focos 
P y q. Para demostrarlo usaremos una construcción análoga a la de la parábola pero 
cambiando el uso de las normales a la directriz (que “vienen” del infinito) por el haz 
de rayos que sale de p. 

Supongamos que H está acabada de determinar por la constante 2a, es decir, que 


Pad ld (x,p) — d (x, q)| = 2a, 
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donde 0 < 2a < d(q,p). Sea C el círculo con centro en p 

y radio 2a, de tal manera que para cada y € C tenemos un 

rayo que sale de p. Para fijar ideas, tomemos una y € C 

que apunta cerca de q (pero no justo a q). Los puntos en el 

rayo Tj, que sale de p hacia y usan este rayo para medir su 

distancia a p. Si tomamos a vy como la mediatriz de y y 

el otro foco q, entonces (como en la parábola) se tiene que 

X := Ty PYy E H pues d (x, q) = d (x, y) (porque x € Vy) y 

d(x,p) = d(x,y)+d(y,p) = d(x,y)+2a (donde estamos 

suponiendo que x está en el rayo que sale de p y pasa por y como en la figura), de 
tal manera que de las dos condiciones obtenemos que d (x,p) — d (x, q) = 2a. 


Antes de seguir adelante, consideremos el otro caso, a saber, 
cuando el punto de intersección x de las rectas n, (por p y 
y € C) y Vy, la mediatriz de y y q, está del otro lado de y 
(es decir, cuando p está en el segmento Xy). Se tiene entonces 
que d (x, q) = d(x,y) = d(x,p) + ad(p,y) = d (x,p) + 2a, 
de tal manera que x está en la otra rama de la hipérbola. 


Hemos demostrado que si y € C es tal que su recta por él y 
Pp, Ny y su mediatriz con q, vy, se intersectan en un punto Xx, 
entonces xX € H. Como en el caso de la parábola, la mediatriz 
vy es ahora el candidato a ser la tangente a H en el punto x. 
Esto se demuestra viendo que |d (x",p) — d (x, q)| < 2a para 
cualquier otro punto x. € Vy y se deja como ejercicio (hay que 


usar dos veces la desigualdad del triángulo). De aquí también se sigue la propiedad 
focal de la hipérbola. 


Pero además, se sigue otro punto clave. La ex- 
istencia de las asíntotas. Hay un par de puntos en el 
círculo C, para los cuales la mediatriz con q es paralela 
a su recta por p. Para que esto suceda para un punto 
y € C, como la mediatriz con q, vy, es ortogonal a 
la recta qy, entonces es necesario (y suficiente) que el 
radio py sea también ortogonal a qy; es decir, que qy 
sea la tangente al círculo C en el punto y. Entonces 
las dos tangentes al círculo C( que se pueden trazar 
desde q, definen dos puntos, Yo y Y1 digamos, cuyas 
mediatrices con q, Vo y v1, son las asíntotas de H. 


PS 
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Para fijar ideas consideremos a los focos p y q en una 
línea horizontal y con p a la izquierda, como en las figuras. Si 
movemos el punto y € C, empezando con el más cercano a Q, 
hacia arriba (contra el reloj), el correspondiente punto x € H 
viaja por la rama de q alejándose arriba a la derecha. Su 
tangente (que empieza vertical) es mediatriz de un segmento 
que gira en q siguiendo a su otro extremo y; entonces la 
tangente gira hacia la derecha, como el reloj. 

Cuando y llegá a yo, el punto x (que viaja en H) se ha “ido al infinito” pero su 
tangente llega plácidamente a vo, la asíntota correspondiente. Al mover otro poco 
a y, la tangente vy empieza a girar contra el reloj (pues el segmento qy empieza a 
bajar) y el correspondiente punto x € H reaparece pero en la otra rama y justo por 
el lado opuesto. Podemos seguir girando a y sin problemas, mientras x recorre toda 
la rama de p, hasta llegar al otro punto de tangencia y¡ (ahora abajo) y tenemos que 
x desaparece (en el infinito arriba), justo cuando la tangente está en la otra asíntota. 
Al seguir girando, x vuelve a cambiar de rama y la tangente de dirección de giro para 
regresar, junto con y, a su lugar de origen. 

Además, obtenemos la interpretación geométrica de los tres parámetros a, b,c en 
el triángulo rectángulo que se forma con el centro, el eje que une los dos focos y una 
de las asíntotas. 


2.5.3 De la elipse 


La propiedad focal de la elipse es que cualquier fotón que emana de un foco se refleja 
en la elipse para llegar al otro foco. De tal manera que si susurramos en uno de 
los focos de un cuarto elíptico, el sonido rebota en la pared y confluye estruendosa- 
mente en el otro foco (pues, además, cada onda sonora que emana de un foco llega 
simultáneamente al otro foco, sin distorsión o delay, pues en todas sus trayectorias 
ha recorrido la misma distancia). Una manera de ver esto es análoga a la que usamos 
para la hipérbola: tomar el círculo de radio 2a centrado en el foco p —este círculo 
contiene el otro foco q, puesto que ahora 2a > d (p, q)—, y luego ver que para los 
puntos de este círculo, su mediatriz con q es tangente a la elipse €. Pero para variarle, 
se la dejamos al estudiante y usamos otro método basado en el clásico “problema del 
bombero”. 

Supongamos que un bombero está parado en el punto p y hay un 
fuego —<que tiene que apagar— en el punto q. Pero tiene su cubeta 
vacía, y entonces tiene que pasar primero a llenarla a un río cuyo 
borde es la recta f. El problema es ¿cuál es la trayectoria óptima que 
debe seguir el bombero? Es decir, para cuál punto Xx € l se tiene que 
d(p,x)+d(x, q) es mínima. En la vida real, y con muchos bomberos 
en fila, se aproximarían a la solución poco a poco. Pero desde nuestra 
cómoda banca de la abstracción, hay una solución muy elegante. 
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No hemos especificado de qué lado del río está el fuego. Si estuviera 
del otro lado que el bombero, cualquier trayectoria al fuego tiene que 
pasar por fl y entonces debe irse por la línea recta de p a q y tomar 
agua en Xo = NM pq. Entonces, si fuego y bombero están del mismo 
lado del río f, podemos pensar en un “fuego virtual”, que es el reflejado 
de q en fl, llamémosle qo, que cumple que d(x, q) = d(x, do) para 
todo x € l, (para q y Go, l es su mediatriz). La solución es, por el 
caso anterior, Xo = LM py. Pero obsérvese además que el ángulo a 
con el que llega el bombero a l es igual al ángulo “de reflexión” con el 
que sale corriendo al fuego (ya con la cubeta llena), e igual al ángulo 
con el que seguiría su trayecto al fuego virtual, y que está propiedad 
determina al punto de mínimo recorrido Xy; es fácil convencerse de que para cualquier 
otro punto de l los ángulos de llegada y de salida son distintos. Si los bomberos fueran 
fotones que emanan de p y l es un espejo, el único que llega a q es el fotón que sigue 
el recorrido mínimo. 

Pensemos ahora que p y q son los focos de una elipse y 
Xy un punto en ella. Sea l la recta que pasa por Xy y bisecta 
(por fuera) los segmentos de p y q a Xy. Por construcción y la 
solución al problema del bombero, cualquier otro punto x € l 
tiene mayor suma de distancias a los focos y por tanto está 
fuera de la elipse. Esto demuestra que l es la tangente a la 
elipse en el punto Xy y, por tanto, su propiedad focal con la que 
empezamos esta sección. 


2.5.4 Telescopios 


Por último, veamos brevemente cómo funciona un telescopio moderno. El haz de 
fotones que viene de una galaxia, digamos, es “paralelo” pues está tan lejos que desde 
la Tierra es imposible medir variación de ángulos (mucho más que los satélites respecto 
a la superficie de las antenas parbólicas). Un gran espejo parabólico 
hace confluir este haz en su foco p. Pero p está del otro lado del espejo. 
Esto se resuelve poniendo un pequeño espejo secundario elíptico y con 
el mismo foco p, que vuelve a reflejar el haz. Éste pasa por un pequeño 
agujero en el centro del primario y vuelve a confluir en su otro foco q, 
que ahora sí está detras del gran espejo primario, y ahí se captura en 
el detector. El hoyo que se hace al primario, así como lo que tapa el 
secundario o la estructura, cuenta poco pues la superficie crece como 
el radio al cuadrado. 

Otra manera de resolver el problema de “regresar el haz” hacia atrás del espejo 
primario, que es la más usada, es poniendo un secundario hiperbólico en vez de uno 
elíptico, con la superficie reflejante por fuera y otra vez con el mismo foco p. De nuevo 
hace reflejar el haz en uno que confluye en su otro foco q, cómodamente situado detras 
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del hoyito del primario. 


Lo que cuenta es qué tantos fotones podemos capturar en el sistema óptico; a 
simple vista es la superficie de la pupila, los telescopios modernos recolectan los 
fotones que chocarían en decenas de metros cuadrados en una dirección dada y los 
hacen pasar, despues de dos reflexiones adecuadas, por la pupila de algún instrumento 
detector. 


2.6 *Armonía y excentricidad 


Hemos definido elipses e hipérbolas como lugares geométricos con base en las propie- 
dades aditivas de distancias. Ahora estudiaremos las cónicas respecto a propiedades 
multiplicativas. Pues resulta que las tres cónicas (elipses, parábolas e hipérbolas) se 
definen también como el lugar geométrico de los puntos x cuya razón de sus distancias 
a un foco p y a una recta l, llamada directriz, es una constante fija e, llamada su 
excentricidad. Es decir, están dadas por la ecuación 


d(x,p)=ed(x,1). 


Para e = 1, ésta es la ecuación de la parábola que ya estudiamos. Veremos que para 
e < 1 se define una elipse y para e > 1 una hipérbola, de tal manera que las tres 
cónicas quedan en una sola familia. Pero notemos que no apareció el círculo. Éste 
tiene excentricidad O que no cabe en la definición anterior (más que como límite). Sin 
embargo, aparece en una instancia (en apariencia) más simple de esta ecuación que 
consiste en tomar otro punto en vez de la línea, y veremos que ligado a esto surge 
naturalmente el concepto clásico de los puntos armónicos. 


2.6.1 *Puntos armónicos y círculos de Apolonio 


Sean p y q dos puntos distintos en el plano. Consideremos la ecuación 
d(x,p)=hd(x,q), (2.18) 


donde h > 0. Para h = 1 ésta es la ecuación de la mediatriz que estudiamos en el 


capítulo anterior, pero a excepción de h = 1 donde da una recta, veremos que esta 


ecuación define círculos: los llamados “círculos de Apolonio”.? 


?También a un círculo tangente a tres dados se le llama “círculo de Apolonio”. 
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Notemos primero que el lugar geométrico C definido 
por (2.18) es simétrico respecto a la línea l que pasa por 
P y 4, Pues si un punto x satisface la ecuación también 
lo hace su reflejado x' respecto a la recta l. De tal mane- 
ra que la recta fl debe ser un diámetro y el círculo debe 
estar determinado por los puntos de intersección LN C. 
Encontrémoslos. 

Sabemos que los puntos de l se expresan en coorde- 
nadas baricéntricas como x = xp + Bq con a+ fB =1, 
donde, si damos una dirección a fl, de p hacia q digamos, y denotamos a las distancias 
dirigidas con d, se tiene que 


> > > 


o — Lx, 9) _d(x,p) _ díip,x) 

d(p, q) d(q,p)  díp,g) 

_ WN De tal manera que si x= xp + 3q € l, entonces 
E B_dípx) 


Por tanto, para encontrar las soluciones de (2.18) en £ basta encontrar las soluciones 
de |B/ad =h con a+f = 1: al sustituir Bf = ha en esta última ecuación, encontramos 
una solución dentro del segmento Pq (con a y f positivas) dada por 


1 h 


Oh : y PT 


—h+1 

Llamemos A al punto correspondiente, es decir, sea A = 04Pp + BB, q. Obsérvese 
que A es el punto medio cuando h = 1; que A está más cerca de p para h< 1 y que 
se aproxima a q conforme h crece. Para h % 1, también tenemos otra solución fuera 
del segmento (que viene de tomar f = —ha), a saber: 


1 oc h 
l—-h 0h — Bn h-—1 By, — 0 
34 

Llamemos b a esta otra solución de (2.18) en £ (es decir, 
b = X4,p + $B5,0), y nótese que b está en el rayo exterior del correspondiente al 
punto, p o q, más cercano a a (h< 1 oh > 1, respectivamente). (Y nótese también 
que la expresión de 04, y (3, en términos de o, y f;, es exactamente la misma.) 

Clásicamente, se dice que la pareja a, b es armónica respecto a la pareja p, q (o 
que A y b son conjugados armónicos respecto a p y q) pues (como reza la definición 
general) los cuatro puntos están alineados y cumplen la relación 


d(p, a)  d(p,b) 


d(a,q) d(b,g) pe 
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que, en nuestro caso, es la “razón de armonía” h. Se tiene claramente que la relación 
de armonía es simétrica (pues p, q son armónicos respecto a 4,b). Y para aclarar 
otro poco su relación geométrica, hay que observar que si en la recta real consideramos 
a Pp y q como los puntos —1 y 1, entonces el conjugado armónico de x es x”!, y el 
0 queda como conjugado armónico del infinito (así como el punto medio de p y Q, 
h = 1, fue un caso especial). 

Ahora sí, demostremos que el círculo cuyo diámetro 
b es el segmento ab está dado por la ecuación (2.18), que 
es, recuérdese, d (x,p) = hd (x, q). En el Ejercicio 2.7 
a se debió demostrar que el círculo con diametro ab está 
dado por la ecuación (x — a) - (x — b) =0 (si no se hizo, 
compruébese ahora). Desarrollemos entonces esta expre- 
sión, basándonos en que los coeficientes son coordenadas 

baricéntricas (%.e., que suman 1): 


(x— a) - (x— b) (x— np — Bn 4) - (x— 0, p— Bj, q) 
(0%, (x— p) + Br (x— q)) - (a; (x — p) + Bj (x— q)) 
= 04,0%, (x— p) - (x—p) + BB, (x— q) - (x- q) 


+ (A Bj + By o, ) (x— p) - (x— q) (2.20) 


= (2) (0-0): (% p) -H?(x-q)-(x- q)), 


donde hemos usado las definiciones —en términos de h 4 1— de nuestros coeficientes 
(véase el Ejercicio 2.21). Se tiene entonces que (x— a) - (x—b) = 0 si y sólo si 
(x—p) - (x-—p) = h?*(x- q) - (x- q), que es justo el cuadrado de la ecuación 
(2.18). 

Además, tenemos al menos otras tres maneras interesantes de detectar armonía. 


Teorema 2.1 Sean p, q, A, b cuatro puntos colineales, y sean Cy y C2 los círculos 
con diametro Pq y ab respectivumente. Entonces son equivalentes: 

1) Las parejas p, q y A,b son armónicas. 

11) Se cumple que (a—p) -(b— q) =-—(a—q)-(b—p). 

12) El punto b está en la línea polar de a respecto a C;. 

iw) Los círculos Ci y Cz se intersectan ortogonalmente. 


Demostración. (i)S(ii). La condición de armonía (2.19) claramente se puede 
reescribir, usando normas para expresar distancias, como 


la—p||b— ql =|a— ql lb— pl. (i) 
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La equivalencia de (i) y (11) se sigue del hecho de que si 
dos vectores u y v son paralelos entonces |ul [w|= + (u - v), 
dependiendo de si apuntan en la misma dirección (+) 
o en direcciones opuestas (—). Esto da inmediatamente 
la implicación (11)>(1), pues por la hipótesis general del 
teorema los cuatro puntos están alineados y entonces sus 
diferencias son paralelas. Para el regreso sólo hay que tener cuidado con los signos. 
Si se cumple (1) es fácil ver que el orden lineal en que aparecen los puntos en la línea 
es alternado (entre las parejas), pues si, por ejemplo, p y q fueran los extremos, un 
lado de (i) es estrictamente menor que el otro. Entonces —renombrando entre las 
parejas si es necesario— podemos suponer que aparecen en el orden p, a, q, b. En 
este caso (i) toma la expresión (11). 

(1) > (ii). Supongamos que p, q y a, b son los de los párrafos anteriores con 
razón de armonía h % 1. Sean o (ojo, no necesariamente es el origen 0) el centro y 
r¡ el radio del círculo C¡, es decir, o = (1/2)(p+ q) y ri =lp — ql /2. De tal manera 
que Cy: (x—0)-(x—0) =r?. 

Por la sección 1.1, ver que b está en la línea polar de A respecto a C¡ equivale a 
demostrar que (a— 0)-(b — 0) = 1%. Pero ya evaluamos (x — a)-(x—b) = (a—x)- 
(b —x) para cualquier x; entonces hay que sustituir O 
en (2.20), para obtener 


—H? (o— q) -(o— g)) 


Por el papel que desempeñó (y desempeñará) el punto O, conviene pensar que sí 
es el origen. Si no lo fuera, lo trasladamos al origen junto con el resto de los puntos 
y las propiedades que nos interesan se preservan. Puede pensarse también que en lo 
que sigue cada letra (b digamos) representa al punto original menos o (a b— 0 en el 
ejemplo). Tenemos entonces que p = —q (pues el origen es ahora su punto medio) y 
que TÍ =p - p. Ahora la condición (iii) equivale a 


a-b=ri, (iii) 


y podemos demostrar la equivalencia de (ii) y (iii) de un solo golpe (aunque un lado 
ya esté demostrado). 
(11) 9 (111). Usando que q = —p, claramente se tiene 


(a—p)-(b-q)+(a—q)-(b—-p)=2(a-b—p-p), 


que concluye la demostración ((ii) es que el lado izquierdo sea cero y (iii) que el lado 
derecho lo es). 
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(111) S (iv). Sean e = (1/2) (a+b) el centro de C>, y r2 = [b— al /2 su radio. 
Que C¡ y C2 sean ortogonales quiere decir que sus tangentes en el punto de inter- 
sección lo son; y esto equivale a que sus radios al punto 
de intersección son ortogonales (pues las tangentes son 
ortogonales a los radios). Por el Teorema de Pitágoras 
esto equivale a que 


1? +13 =]e!? (iv) 


(pues C¡ está centrado en el origen, así que [el es la dis- 
tancia entre los centros), que es lo que tomamos en ade- 
lante como (iv). Sabemos, por hipótesis, que A y b son paralelos y hay que observar 
que ambas condiciones (a-b =r? > 0 y ri+13= le?) implican que están del mismo 
lado del origen. Podemos suponer entonces que A es “más pequeño” que b, y entonces 


le? = (lal+r,) 
= la/(la] +2r,) +13 
= Jallb| +15 
= a-b+1. 
Lo cual demuestra la equivalencia (111) 5 (iv) y concluye el Teorema. O 


En resumen, los círculos de Apolonio de un par de puntos p y q son los ortogonales 
al círculo que los tiene como diámetro y cuyo centro está en esa línea, y además la 
cortan en sus conjugados armónicos; teniendo como límites los “círculos de radio cero” 
en P y en q y su línea mediatriz. 


EJERCICIO 2.21 Demuestra que 048, = —Bh 04, (usando la definición de los corre- 
spondientes primados sin referencia a h); y usando las definiciones con base en h, demuestra 
que 
1 h? 
¡0 nr 
Ano =3 2 Y PnBn= 377 


son las coordenadas baricéntricas del centro del círculo (2.18) respecto a p y q. 


EJERCICIO 2.22 Sean p y q dos puntos en un círculo C 
con centro 0; y sea A un punto en el segmento Pq distinto del 
punto medio, es decir, A =Ap+q con a+fB=1,0<a<l 
y x% f. Demuestra que el punto armónico de A respecto a 
P y 4 (llamémoslo b) está en la línea polar de a respecto al 
círculo C. (Expresa b en coordenadas baricéntricas respecto a 
P y 9, y sustituye en la ecuación de la polar de a). Concluye 
que la línea polar de un punto a en el interior de un círculo 
consiste de todos sus armónicos respecto a la intersección con el círculo de las líneas que 
pasan por el. 
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2.6.2 *Excentricidad 


Demostraremos ahora que elipses e hipérbolas se definen por la ecuación 
d(x,p) =ed(x,), (2.21) 


con e< 1 y e > 1 respectivamente, donde p es uno de sus focos, y a l la llamaremos 
su directriz correspondiente. La constante e se llama la excentricidad de la cónica, y 
ya sabemos que las de excentricidad 1 son las parábolas. 


Consideremos la elipse canónica € con centro en el origen y semiejes a > b en los 
ejes coordenados. Sabemos que sus focos están en p = (c,0) y q = (—c,0), donde 
c > 0 es tal que b? + c? = a?. Sabemos además que € intersecta al eje x, que es su 
eje focal, en los puntos (a, 0) y (—a,0). 

Resulta que la directriz de € correspodiente al foco 
Pp es ortogonal al eje x y lo intersecta en el conjugado 
armónico de p respecto a los puntos de intersección; es 
decir, es la línea polar a p respecto al círculo x-x = a? 


(que, notémoslo, es doblemente tangente a €). Sea 
entonces l definida por la ecuación 


De los datos que tenemos podemos deducir su excentricidad (pues del punto (a, 0) € € 
conocemos sus distancias a p y 2), que resulta e =c/a < 1. Desarrollemos entonces 
a la ecuación (2.21) en coordenadas para ver si son ciertas las afirmaciones que nos 
hemos sacado de la manga de la historia. 


Puesto que ambos lados de (2.21) son positivos, esta ecuación es equivalente a su 
cuadrado que en coordenadas (y nuestra definición de p,l y e) toma la forma 


2 q? 
x—=0 +y? = (E) (5 
a a 
2 2 4 
Pi 2 - e pl a a 
lux Feo” = (3) (> 24 5) 


7 

a? —€ 

( 7 )e+v = a—e?. 
a 


De aquí, al dividir entre b? = a? — c? se obtiene la ecuación canónica de la elípse € 
y quedan demostradas todas nuestras aseveraciones. 
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Para una hipérbola H, de nuevo la directriz correspondiente a 
un foco es perpendicular al eje focal y lo intersecta en su conjugado 
armónico respecto a los puntos de intersección con H. De tal 
manera que podemos tomar exactamente los mismos datos del caso 
anterior (p = (c,0), £: cx = a? y e=c/a), y la ecuación (2.21) se 
desarrolla igual. Pero ahora tenemos que c > a (la excentricidad 


es mayor que l, e =c/a > 1) y entonces definimos b > 0 tal que 
a? + b? = c?; de tal manera que en el último paso hay que dividir 
entre —b? para obtener 


a e, re 
al bo” 


La excentricidad de una cónica es un invariante de semejanza , es decir, si mag- 
nificamos (hacemos 200m) o disminuimos una cónica, su excentricidad se mantiene. 
Pues esta magnificación (o contracción) se logra alejando (o acercando) al foco p y a 
la directriz f. Pero si fijamos a estos últimos y variamos la excentricidad e, se cubre 
por cónicas todo el plano (exceptuando a p y l que aparecen como los límites e > 0 
y € > 00 respectivamente) pues cualquier punto da una razón específica entre las 
distancias y por tanto una excentricidad que lo incluye. 

Recreemos la construcción de la parábola a partir 
de las mediatrices, pero ahora con círculos de Apolo- 
nio. Si P es la cónica con foco p, directriz l y excen- 
tricidad e (puede ser elipse, parábola o hipérbola), y 
para cada punto y en fl tomamos el círculo de Apolo- 


nio Cy entre p y y con razón de armonía e, entonces 
está claro que Cy NAVy CP (donde v, es la normal a 
l en y). Pues la distancia de un punto en vy a l cor- 
responde a su distancia a y; y si está en Cy la razón 
de las distancias a p y y es la adecuada. Pero ahora, 
Cy Ny no es necesariamente un punto pues, salvo el 
caso e = 1 donde C, es la mediatriz, un círculo intersecta a una recta en 2,100 
puntos. 

Para el caso e < 1, los círculos de Apolonio C,, contienen a p en su interior; crecen 
conforme y se aleja en £, pero llega un momento (que corresponde al semieje menor 
de la elipse) en el que v, ya no los corta. Por el contrario, para e > 1 los círculos de 
Apolonio contienen a y, y entonces V, siempre los corta en dos puntos que dibujan 
las dos ramas de la hipérbola. 

En ambos casos, si Cy corta a vy en X, digamos, entonces por un argumento 
análogo al de la parábola se puede ver que está fuera de P, es decir, que Cy es 
tangente a P en X, pero en este caso, y salvo por el último toque a una elipse en el 
semieje menor, también es tangente a P en otro punto. Para la hipérbola es fácil 
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verlos, simplemente dejando caer un círculo hacia el centro y si es más grande que la 
cinturita: ahí donde se detiene es un Cy, con y correspondiendo a la altura de los dos 


puntos de P donde se atoró. 


2.7 *Esferas de Dandelin 


Hemos desarrollado todo este capítulo a partir de las definiciones planas de las cónicas 
por propiedades de distancias. Sin embargo, en su introducción empezamos como 
los griegos: definiéndolas en el espacio como intersección de un cono con planos. 
Veremos brevemente que tal definición corresponde a la que usamos, basándonos en 
una demostración que data de cerca del año de 1800 debida a un tal Dandelin. 


Para definir un cono C en 


R3, consideremos una línea £ por el 


origen en el plano yz con un ángulo « respecto al eje y: y hagá- 
mosla girar alrededor del eje z. De tal manera que la intersección 
de C con un plano horizontal (z = c, digamos) es un círculo cen- 
trado en “el origen” ((0,0,c), y de radio c cos a/ sin x). Por la 
definición, es claro que para cualquier punto x € C, su recta por 

>Y el origen, que denotaremos con (,, está contenida en el cono, y 
la llamaremos la recta del cono por X. Queremos hacer ver que 
cualquier plano TT que no contenga al origen intersecta el cono C 
en una cónica (definida por distancias). 


NU 


Las esferas tangentes al cono son esferas ay ( 


con centro en el eje z y que tocan al cono pero 
que no lo cortan, es decir, que tienen a todas las líneas del cono 
como líneas tangentes. Si dejamos caer una esfera dentro del cono 


se asienta en una esfera tangente. Es claro que las esferas tan- y 


gentes se obtienen al hacer girar en el eje z un círculo centrado 
en él y tangente a la línea generadora (€; que para cada radio hay 
exactamente dos esferas tangentes (una arriba y una abajo), y que 
para cada punto del eje z hay una única esfera tangente centrada 


en él. Además, cada esfera tangente al cono lo intersecta en un 
círculo horizontal llamado su círculo de tangencia o de contacto. 
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Tomemos ahora un plano TT casi horizontal. Este plano TT tiene exactamente dos 
esferas tangentes que también son tangentes al cono C, que llamaremos sus esferas de 
Dandelin, Di; y Dz. Veamos y, para fijar ideas, pensemos que el plano TI intersecta 
el cono arriba del origen, pero no muy lejos. Si pensamos en una esfera muy grande 
tangente al cono, ésta está muy arriba; al desinflarla (manteniéndola siempre tangente 
al cono) va bajando. Hay un primer momento en el que toca a TT, ésa es D¡. Al seguir 
desinflándola, intersecta a TÍ en círculos, y hay un último momento 
en que lo toca —esa es D¿— para seguir decreciendo, insignificante, 
hacia el origen. 

Más formalmente, y sin perder generalidad, podemos suponer 
que el plano TT contiene la dirección del eje x; entonces las esferas de 
Dandelin de TT corresponden a dos de los cuatro círculos tangentes a 
las tres rectas que se obtienen de intersectar el plano yz con el plano 
TT y el cono C (precisamente, los dos que caen dentro del cono). 


Sean pi y P2 los puntos donde D, y D, tocan, respectivamente, 
el plano TT. Estos serán los focos de la elipse TT ANC. Para verlo 
necesitamos un lema que es más difícil enunciar que probar. 


Lema 2.2 Sea D una esfera de Dandelin de un plano Tl. Sea p su punto de contacto 
con TM; y sea S el círculo de tangencia de D en C. Para cualquier x € INC, sea y 
la intersección de la recta del cono por X y el círculo de tangencia, 1.e. y =S MC; 
se tiene entonces que 


d (x,p) = d(x,y). 


Basta observar que los segmentos Xp y Xy son ambos tangentes 
a la esfera D y que, en general, dos segmentos que salen del mismo 
punto y llegan tangentes a una esfera miden lo mismo. O 


Ahora sí, podemos demostrar que TIN C es una elipse tal como 
la definimos. Sean S¡ y S, los círculos de tangencia de las esferas 
de Dandelin D; y D,, respectivamente. Dado x € TT NC, según el 
lema, sus distancias a los respectivos focos se pueden medir en la línea del cono como 
las distancias de x a los círculos de tangencia Si y S2. Como x está entre estos dos 
círculos, la suma de las distancias es constante (a saber, es la distancia, medida en 
líneas del cono, entre S; y $2). 

Cuando el plano TT es cercano a un plano vertical (incluyendo 
este caso), se tiene que TT intersecta ambos lados del cono C. Pero 
también tiene dos esferas de Dandelin tangentes a él y al cono. 
De nuevo, sus puntos de tangencia con el plano son los focos de la 
hipérbola TTA C, y la demostración es análoga (usando el lema). 
Dejamos los detalles al lector (siguiente ejercicio), pues para el 
caso de la parábola necesitamos encontrar la directriz, y su análisis 
incluirá los tres casos. 
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Supongamos que el plano TI tiene un ángulo (4 > O respecto al plano horizontal 
xy, y que D es su esfera de Dandelin, es decir, que es tangente a TI y al cono C con 
punto y círculo de contacto p y S respectivamente. Sea A el 
plano horizontal que contiene al círculo de tangencia S. Sea 
£=TIN A, línea que podemos pensar como paralela al eje x 
y que llamaremos la directriz. 

Consideremos un punto x € INC. De la proyección al 
plano yz, es fácil deducir que 


d(x,f)senf =d(x,z), 


donde z es la proyección ortogonal de x al plano horizontal 
A. Tomemos ahora el plano vertical que pasa por x y el eje 
Z. Claramente contiene a Z y a la línea del cono (, que pasa 
por x; y es fácil ver en él que 


d (x,z) = d (x, y) sen «, 


donde y = (¿NA (justo la y que aparece en el lema). De 
estas dos ecuaciones y el lema se sigue que 


sen 
d (x,p) = ne 


dix, Ll. 


Esto demuestra que los planos que no pasan por el origen (los que tienen esferas de 
Dandelin) intersectan el cono C en cónicas cuya excentricidad depende de los ángulos 
(tal como queríamos demostrar). 

Obsérvese que no eliminamos los planos horizontales (f$ = 0) de la afirmación 
anterior. Cuando el plano TI tiende a uno horizontal, la cónica se hace un círculo, el 
foco p tiende a su centro y la directriz l se aleja hacia el infinito. 


EJERCICIO 2.23 Concluye la demostración de que TT NC es una hipérbola cuando las 
dos esferas de Dandelin de TI están en los dos lados del cono usando a éstas y a los dos 
focos. 

EJERCICIO 2.24 Demuestra que si $ = a, entonces el plano TÍ tiene una única esfera 
de Dandelin (el caso de la parábola). 
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Capítulo 3 


Transformaciones 


Sin duda, el concepto de función tiene un papel fundamental en todas las ramas de 
la matemática de hoy en día: en la geometría elemental (aunque sea antigua), se 
dice que dos figuras son congruentes si existe una transformación rígida que lleve 
una sobre la otra, y que son semejantes si existe una de estas transformaciones que 
seguida de una homotecia (un cambio de escala) lleve una a la otra; en el análisis 
o el cálculo se estudian las funciones integrables o diferenciables; en la topología, 
las funciones continuas; en la teoría de los grupos se estudian los homomorfismos 
(funciones entre grupos que preservan la operación ahí definida); en el álgebra lineal se 
estudian las funciones lineales y las afines, etc.; siempre que hay algún tipo interesante 
de “objetos matemáticos” parece haber una correspondiente noción de “funciones” 
que los relacionan. 


Sin haberlo hecho explícito, los griegos manejaban intuitivamente el concepto de 
transformación rígida y de semejanza; por ejemplo, en el axioma “todos los ángulos 
rectos son iguales”, en la palabra “iguales” se incluye la idea de que se puede mover 
uno hasta traslaparse sobre el otro, y en sus teoremas de semejanza la noción ya se 
hace explícita y habla en el fondo de un cierto tipo de funciones. Más adelante, en el 
surgimiento del cálculo (Newton y Leibniz) así como en el de la geometría analítica 
(Descartes) o en el algebra de los arabes, las funciones tenían un papel importante 
pero debajo del agua o en casos muy concretos (funciones reales de variable real dadas 
por fórmulas en el cálculo, por ejemplo). Sin embargo, el aislamiento del concepto de 
función, la generalidad de la noción —que englobaba cosas al parecer distantes—, es 
muy reciente: termina de afinarse con la teoría de los conjuntos que arranca Cantor en 
la segunda mitad del siglo XIX. Pero es tan inmediata su aceptación (o bien, ya estaba 
tan madura su concepción) que a finales del siglo XTX, Felix Klein, en una famosísima 
conferencia (conocida como “El Programa de Erlangen” ), se atreve a afirmar, basado 
en el trabajo de su gran amigo Sophus Lie, que la geometría es el estudio de un espacio 
(un conjunto de puntos, piénsese en el plano) junto con un grupo de transformaciones 
(un conjunto específico de funciones del espacio en sí mismo) y de las estructuras que 
permanecen invariantes bajo el grupo. En fin, todavía el estudiante no tiene ejemplos 
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claros de estas nociones y es casi imposible que lo aprecie. Pero el punto es que, 
de alguna manera, Klein dijo: para hacer geometría es importantísimo estudiar las 
transformaciones (funciones) del plano en sí mismo, conocerlas de arriba a abajo; y 
en este capítulo eso intentamos pues el siglo XX, al transcurrir, le fue dando más y 
más razón al visionario. 

Damos muy rápidamente las nociones generales de función en la primera sección. 
Pues, aunque parece que se nos cae el nivel por un ratito, vale la pena establecer cierta 
terminología muy general que se usa en su manejo y ciertos ejemplos muy particulares 
que serán de gran interés en el estudio de las transformaciones geométricas y que, a su 
vez, servirán para familiarizarnos con los conceptos básicos. Después entramos a las 
transformaciones geométricas. El orden en que lo hacemos no es el que técnicamente 
facilita las cosas (empezar por transformaciones lineales), sino el que intuitivamente 
parece más natural (empezar por transformaciones rígidas); y de ahí, deducir la noción 
de transformación lineal para regresar de nuevo y desarrollar las fórmulas analíticas. 


3.1 Funciones y transformaciones 


En los siguientes párrafos se usa el tipo de letra este para las nociones que se 
definen formalmente y este otro para terminología cómoda y coloquial que facilita 
mucho el manejo de las funciones. 

Dados dos conjuntos A y B, una función f de A a B, de- 

f notado f: A — B, es una manera de asociar a cada elemento 

Fa $ B a € A un elemento de B, denotado f(a). Por ejemplo, las 
ON | funciones de RR en |R se describen comúnmente mediante fór- 
Las > f(a) mulas como f(x) =x? o g(x) = 2x + 3, que dan la regla para 

A) asociar a cada número otro número (por ejemplo, f(2) = 4 o 

g(—1) = 1). Otro ejemplo: en el capítulo 1 vimos las fun- 

ciones de IR en R? que describen rectas parametrizadas. Pero en general, y ésa es la 
maravillosa idea generalizadora (valga el pleonasmo), una función no tiene por qué 
estar dada por una fórmula; a veces es algo dado por “Dios”, una “caja negra”, que 
“sabe” como asociar a los elementos del dominio (el conjunto A, en la notación con 


que empezamos) elementos del contradominio B. f 
Se dice que una función f : A —= B es inyectiva PESAR 
si f(a) = f(a') implica que a = E A 
Ma | 
tos diferentes de B (a 4% al > y 
fla) 4 f(a”)). Se dice que una 
función f: A — Bes suprayectiva o sobre si para cada ele- 


a'. Es decir, si elementos difer- | 
mento de B hay uno en A que le “ pega”, es decir, si para cada 
b € B existe a € A tal que f(a) = b. Y se dice que es biyectiva 


entes de A van bajo f a elemen- 


o una biyección, 
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si es inyectiva y suprayectiva; también se le llama correspondencia biunívoca. (Dia- 
gramas de funciones no inyectiva y no sobre en las figuras adjuntas). 

Las funciones tienen una noción natural de composición, al aplicarse una tras 
otra para dar una nueva función. Dadas dos funciones f: A >Byg:B >C, su 
composición, denotada g of y a veces llamada f seguida de g o bien “g bolita f” es 
la función 

gof:A=>C gof 


definida por la fórmula SS 
(90 f)(a) = gíf(a)). FETO 
NY NY 


Hay que resaltar que la composición de funciones está definida sólo cuando el 
dominio de g (es decir, de donde “sale” o en donde está definida, el conjunto B en 
nuestro caso) es igual al contradominio de f (es decir, a donde “llega”, el final de la 
flecha, donde “caen”, otra vez B en nuestro caso); si no fuera así, “g no sabría que 
hacer con algunos f(a)”. También hay que resaltar que la dirección de la escritura 
“g bolita f” es la contraria a la de la acción o lectura (“f seguida de g” o bien “f 
compuesta con g”); y esto se ha convenido así por la costumbre y puesto que la 
fórmula, que a final de cuentas es la que manda, queda mucho más natural. 

Por ejemplo, con las funciones f,g : ¡R — IR que definimos con fórmulas unos 
párrafos antes se tiene que (gof)(x) = 2x?+3 mientras que (fo g)(x) =4x?+12x+9, 
así que sí importa el orden; la composición está lejos de ser conmutativa; en general, 
aunque go f esté definida, f o g ni siquiera tiene sentido. 

Cada conjunto A, trae consigo una función llamada su ¿identidad definida por 


ida: A > A 

ida (a) =.0, 
que es la función que no hace nada, que deja a todos en su PRE DN, 
lugar. Y, aunque parezca inocua, es fundamental darle un A LOBO) 


| 
nombre, pues entonces podemos escribir mucho, por ejemplo: o AR 
- g 


Lema 3.1 Dada una función f : A — B, se tiene 


i) fesinyectiva + 3 g:B>A  talque gof=ida, 
11) f es suprayectiva $ 3 g:B>A  talque fog=idg. 


EJERCICIO 3.1 Da ejemplos de funciones inyectivas que no son sobre y a la inversa. 


EJERCICIO 3.2 Demuestra el lema anterior y el siguiente corolario de él. 


Corolario 3.2 Dada una función f : A — B, entonces f es biyectiva si y sólo si 
existe una función g: B => A tal que gof =ida yfog =idp. 
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En este caso, a g se le da el nombre de inversa de f y se le denota f7?. Aunque aquí 
hay que hacer notar que el símbolo f7? se usa también de una manera más general 
para denotar conjuntos. Pues para cualquier subconjunto B” € B podemos definir su 

imagen inversa o pre-imagen f7!(B') C A como 


a Rm 7 fIUB):=lacAlfía)eB”. 


(IÓ Tenemos entonces que f es inyectiva si y sólo si para todo 
VFB) | A | b € B se tiene que tf7*(b) < 1 (donde 4 denota cardinalidad 
o De 77) y hemos identificado f*(b) con f-*((b))), es decir, “a cada 
elemento de B le pega a lo más uno de A”; y que f es sobre 
si y sólo si para todo b € B se tiene que tf 1(b) > 1 (es decir, que f7'(b) no es el 
conjunto vacío). Por lo tanto, f es biyectiva si y sólo si 4f7*(b) = 1 para todo b € B, 

es decir, si y sólo si f7! es una función bien definida al aplicarla a singuletes de B. 


También se puede definir la ¿magen directa de subconjuntos A” C A, o simplemente 
su imagen, como 


f(A5) :=[fla) | ac APC B; 
y la imagen de la función es f (A), la imagen del dominio. 
Finalmente llegamos a la definición que más nos interesa. 
Definición 3.1.1 Una transformación de A es una función biyectiva de A en A. 


Hay que hacer notar que el término “transformación” se usa de diferentes maneras 
en otros textos y en otros contextos. Pero aquí estaremos tan enfocados a funciones 
biyectivas de un conjunto en sí mismo que lo asignaremos a ellas. 


EJERCICIO 3.3 Demuestra que sif: A=— B y g: B —> C son biyectivas entonces g o f 
también es biyectiva. (Demuestra que (g of)! =f"1 0 g”!.) 


EJERCICIO 3.4 Demuestra que si f y g son transformaciones de un conjunto A entonces 
(fo g) también es una transformación de A. 


3.1.1 Grupos de transformaciones 


Veremos ahora ciertos ejemplos pequeños de conjuntos de transformaciones, que por 
su importancia reciben un nombre especial, el de grupo. 

Consideremos un conjunto con dos elementos, (0,1); llamémoslo Az, que se lee 
“delta-dos”. Las funciones de A, en sí mismo son cuatro : 


id Co C1 p 
0 — 0 0—_>0 0 — 1 0 — 1 
l > 1 1—>0 li= 1 1200, 


donde hemos usado la notación x +— y para especificar que el elemento x va a dar 
al elemento y bajo la función en cuestión (no hay que confundir la flechita con “raya 
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de salida” +— con la flecha —> que denota función; inclusive puede pensarse que 
esta última (=>) es el conjunto de todas las flechitas (+—>) entre los elementos). En 
nuestro ejemplo, las dos funciones de enmedio son funciones constantes; y las únicas 
transformaciones son las de los extremos, id y p, donde hay que observar que p es su 
propio inverso, es decir, po p = id. 

Consideremos ahora a Az :=(0, 1,2), un conjunto con tres elementos. Una función 
de Az en sí mismo puede especificarse en una tablita: 


0 —> x 
l — y 
2 —a 2, 


donde x,y,z € Az. Como las imágenes (x, y, z € Az) son arbitrarias, tenemos que hay 
3%? = 27 funciones en total; pero de éstas solamente 3x 2x1 = 6 son transformaciones. 
Pues si queremos que sea biyectiva, una vez que el 0 escoge su imagen, al 1 sólo le 
quedan dos opciones para escoger y cuando lo hace, al 2 ya no le queda más que una 
opción obligada. 


Estas seis transformaciones son: O 8 ON 
j P ] 
0 


id P: | | 
0>0 0 :>1 => 2 y a E y 
lo — 1 li > 2 120 Pe a 
2 —_ 2 2—> 0 2 —> 1 

a B Y ESOS 
0 — 0 0 —> 2 0 — 
l—= 2 l —> 1 lr 0 
2 —> 1 2—> 0 2 _a 2 7 


Q 


que podemos visualizar como las “simetrías” de un triángulo equilátero. Vistas así, 
las tres de arriba corresponden a rotaciones (la identidad rota 0 grados), y cumplen 
con que py y p, son inversas, es decir p¡ o p, = P, 0 Pp] = id, lo que corresponde a que 
una rota 120” en una dirección y la otra 120? en la dirección contraria. Pero también 
cumplen que p, o p, =p, (que podríamos escribir p? = p, si convenimos en que 


AA 
f=tofo..etf, 


donde f es cualquier transformación; es decir, f" es f compuesta consigo misma n 
veces, lo cual tiene sentido sólo cuando f sale de y llega al mismo conjunto). Por 
su parte, las tres transformaciones siguientes se llaman transposiciones y geométrica- 
mente se ven como reflexiones. Cumplen que a? = $? = y? =id, y además cumplen 
otras relaciones como que xo f = py, lo cual se ve persiguiendo elementos: 


15) o 
0 > 2 hm 1 
lr >1l 2 
2 —>0mkm00; 
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o bien, que xoBox=fBoao fi = y (¡compruébalo persiguiendo elementos!). Para 
poder concluir con elegancia, conviene introducir las siguientes nociones generales. 
Hay ciertos conjuntos de transformaciones que son tan importantes que conviene 
darles un nombre específico, el de grupo: 


Definición 3.1.2 A un conjunto G de transformaciones de un conjunto A se le llama 
un grupo de transformaciones de A si cumple 


i) ida € G 
li) f geG=>gofeG 
iii) feG=>f EG. 


Ejemplos triviales de grupos serían el conjunto de todas las transformaciones de 
A, o bien, sólo su identidad, [ida ). 

En el caso de A = Az, el grupo de todas sus transformaciones tiene seis elementos; 
pero también hay otro grupo de transformaciones que consiste en las tres del primer 
renglón, las rotaciones; pues contiene a la identidad (es un conjunto no vacío), es 
cerrado bajo composición (cumple (1i)) y es cerrado bajo inversas (cumple (i1i)). Y 
también cada una de las transposiciones (o reflexiones) junto con la identidad forman 
un grupo (con dos elementos) de transformaciones de Az. 


Dado un conjunto cualquiera de transformaciones de A, el grupo que genera es 
el grupo de transformaciones que se obtiene de todas las posibles composiciones con 
elementos de él o sus inversos. 


Por ejemplo, x y B generan todas las transformaciones de Az (pues ya las hemos 
descrito como composiciones de x y $); mientras que p¡ genera el grupo de rotaciones 
de Az (que consiste de id, p, y pf =p). Las relaciones que cumplen a y fB son 


ol =p?=(fBoa)? =id. 


Si consideramos ahora a Ay :=(0,1,2,3), tendríamos que el conjunto de sus fun- 
ciones tiene 4* = 256 elementos, mientras que el grupo de todas sus transformaciones 
tiene 41 =4x3x2x 1 = 24 elementos (demasiados para escribirlos todos). Pero 
dentro de éste, podemos encontrar otros grupos, que podemos llamar subgrupos. 


Uno importante es el de aquellas transformaciones que mantienen 

0 intacta (que preservan) la estructura del cuadrado regular cuyos vértices 

se etiquetan 0, 1, 2,3 en orden cíclico; por ejemplo, la que mantiene fijos 

al 0 y al 1 pero que transpone al 2 y al 3 no preserva al cuadrado pues, 

por ejemplo, la arista del 1 al 2 va a una diagonal, la 1—3. No es 

A dificil ver que éstas (las simétrias del cuadrado) son ocho: las cuatro 
rotaciones (incluyendo a la identidad), y cuatro reflexiones. 
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Pero en vez de escribirlas todas podemos describirlas mediante 
generadores. Sean ahora 


o B 
0 0 0 +.» 1 
la 3 120 (3.1) eS 
2.42 2. 3 99 
3»1.3>22 2 e 


PB 


entonces f o a es la rotación (0+> 12H 30450) y las otras dos rotaciones del 
cuadrado son (fB o a)? y (fB o a)?*; mientras que las dos reflexiones que faltan describir 
son (xo fo a) y [Boao f). Podemos entonces concluir que el grupo de simetrías 
del cuadrado está generado por a y f que cumplen las relaciones 


0” =P*=(BoaJ* =id, 


mientras que el grupo de rotaciones tiene un solo generador p = (f o x) que cumple 
p* =id. 

Para referencia posterior, y a reserva de que se estudien con más detenimiento en 
el caso general en la Sección 3.3.2, conviene poner nombre a los grupos de transfor- 
maciones que hemos descrito. 

Al conjunto de todas las transformaciones de un conjunto con n elementos A, := 
f0,1,...,.n— 1) se le llama el grupo simétrico de orden n; se le denota S, y consta de 
ni i=nx(n-1)x (n-2)x...x2x1 (n factorial) elementos también llamados 
permutaciones. 

Dentro de este grupo hemos considerado dos subgrupos (para n = 3,4): el que 
preserva la estructura del polígono regular con n lados cuyos vértices se etiquetan 
0,1,2,..., (n—1) en orden cíclico, al cual se le llama el grupo diédrico 2 
de orden n, y se le denota D.,,, que tiene 2n elementos; y el subgrupo E 
de éste generado por la rotación (05 1+52+H5..+(n-—1) > 0) 
que tiene n elementos, se le llama grupo cíclico de orden n y se le 
denota C,. Hay que observar que para n = 3 el diédrico y el simétrico 
coinciden (Sz = Dz) pero esto ya no sucede para n = 4. 


asignaciones) las ocho transformaciones del grupo diédrico D4; su expresión más económica 
(en el número de símbolos usados) como composición de x y fP (definidas por las tablas de 
asignaciones (3.1)), y también da su representación geométrica. 

EJERCICIO 3.6 ¿Puedes encontrar un subgrupo de S4 “esencialmente igual” a Sz3? 
EJERCICIO 3.7 ¿Puedes encontrar un subgrupo de S¿ de orden 12? (Piensa en un 
tetraedro regular en R3 y describe el grupo geométricamente.) 

EJERCICIO 3.8 ¿Puedes encontrar una permutacion y : Ay > Ay tal que a, fB y 
y generen todas las permutaciones S4 (por supuesto que y E D4)? 
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EJERCICIO 3.9 Da explícitamente (con la tabla de asignación An —> An) dos genera- 
dores « y f para los grupos diédricos de orden n = 5 y n = 6 (es decir, para las simetrías 
del pentágono y el hexágono). ¿Qué relaciones cumplen? ¿Puedes intuir y describir lo 
equivalente para el caso general? 

*EJERCICIO 3.10 Considera un cubo Q en R*. Etiqueta sus vértices con Ag. Dentro 
de Sz hay un subgrupo que es el que preserva la estructura geométrica del cubo. ¿Cuántos 
elementos tiene? ¿Puedes describirlo con generadores y relaciones? 


3.2 Las transformaciones afines de R 


El primer grupo de transformaciones geométrico-analíticas que estudiaremos es el 
que surge de la ambigiúedad en la parametrización de rectas. Recuérdese que nuestra 
definición original de una recta fue con un parametro real, pero para una sola recta 
hay muchas parametrizaciones (dependen de escoger un punto base y un vector di- 
reccional); la forma de relacionarse de estos parametros serán las transformaciones 
afines. 


Supongamos que tenemos una misma recta l parametrizada de dos 
maneras distintas. Es decir, que tenemos 


l = [p+tv:teR) 
l = [q +su:sek), 


donde p, q, v, u € R? (aunque también funcione el razonamiento que 
sigue en cualquier espacio vectorial). Sabemos además que los vectores 
direccionales, U y v son distintos de O para que efectivamente describan 
una línea recta. La pregunta es ¿cómo se relacionan los parametros t y s? 


Otra manera de pensar estas rectas es como la imagen de funciones cuyo dominio 
son los reales, es decir, tenemos dos funciones f, g : R — R? definidas por 


= Ty 
f(t) = p+tv 
g(s) = q>+—su, - 
f E der 
cuya imagen es la misma recta fl. Puesto que ambas 3 
son biyecciones sobre f, podemos restringir el codo- $ 
minio y pensarlas a ambas como funciones de R en e 


l. Y entonces tiene sentido hablar de sus inversas dl 
f":l>Ryg"':2>R. La pregunta es entonces 
¿cómo se expresan las funciones (g7! of) y (f7! o g) 
que van de R en R? 
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Puesto que u y v son paralelos (definen la misma recta), existe un número real 
a € R tal que u = av; de hecho a = (u-v) / (vv), y obsérvese que a 4 0. Y 
además como q € fl, se puede expresar en términos de la primera parametrización; es 
decir, existe b € ¡R tal que q =f(b) =p +bv. Tenemos entonces que para cualquier 
sER: 


gls) = q+su 
= p+bv+s(av) 
= p+(as+b)v 
= f(as +b); 


al aplicar la función f7! a ambos lados de esta ecuación se obtiene 
(flo g)(s) = as +b. 


Para obtener la otra composición, podemos proceder más directamente, con- 
siderando esta última expresión como la que da al parametro t. Es decir 


t=as+b, 
de donde, como a % 0, podemos despejar 


s=at-ba”. 


Definición 3.2.1 Una función f : R —> RR se llama afín si se escribe como 


f(x) = ax +b, (3.2) 


donde a,b € R; y cuando a 4 0 la llamaremos transformación afín. 


Nuestro uso de el término transformación se justifica por el siguiente ejercicio. 


EJERCICIO 3.11 Demuestra que la función afín (3.2) es biyectiva si y sólo si a 4 0. 
EJERCICIO 3.12 Sean f,g : R — R definidas por f(x) = 2x + 1 y g[(x) = —x +2. 
Encuentra las fórmulas para 7), g 1, f?,fog y gof. 


EJERCICIO 3.13 Demuestra que las transformaciones afines son cerradas bajo inversas 
y composición. 


Obsérvese que las gráficas de las funciones afines son las rectas no verticales, pues 
éstas están dadas por la ecuación y = ax+b. Y que de éstas las rectas no horizontales 
corresponden a las transformaciones afines. 

Al conjunto de todas las transformaciones afines de R, que por el ejercicio anterior 
forman un grupo, lo denotaremos Af(1). 

Podemos ahora resumir lo que hicimos en los párrafos anteriores. 


Lema 3.3 Dos parametrizaciones de una misma recta se relacionan por una trans- 
formación afín entre los parámetros. Ol 
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Así como las parametrizaciones de rectas dependen de la elección de dos puntos 
en ellas, las transformaciones afines dependen únicamente de dos valores. Pues las 
constantes que la definen, a y b en nuestro caso (3.2), se 
obtienen como 0 1 a 


= (0) Ma b 


t(1)=1(0] 
y representan un cambio de escala (multiplicar por a) y luego una traslación (sumarle 


b). De tal manera que si nos dicen que f es una función afín que manda al 0 en b 
(f(0) =b) y al 1 en e (f(1) =cC), recuperamos toda la función por la fórmula 


f(x) = (c — b)x+b, 


y Obsérvese que es transformación cuando f(0) 4 f(1); si no: es constante. Si el O y 
el 1 pueden ir a cualquier pareja de números por una transformación afín, entonces 
cualquier pareja de números (distintos) puede ser enviada al 0, 1 (por la inversa) y 
de ahí a cualquier otra pareja. Hemos demostrado así el: 


Teorema 3.4 (Dos en Dos) Dados dos pares de puntos Xo, X1 Y Yo, Yi en R, 
(donde por par se entiende que son distintos, 1.€., Xy 4 X1 Y Vo A Y1), existe una única 
transformación afín f € AF) que manda una en la otra, i.e., tal que f(xo) = Yo Y 
f(x1) =y1. O 


EJERCICIO 3.14 Encuentra la transformación afín f : R — IR que cumple: 


a) f(Q2)=4 y f(5)=1 
b) f(l)=-1 y f(2)=3 

c) fí-)=0 y f(3)=2 

EJERCICIO 3.15 Encuentra la fórmula explícita (en términos de Xo, X1, Yo, Y1) de la 
función f del Teorema 3.4. 

EJERCICIO 3.16 Discute qué pasa en el Teorema 3.4 (y en la fórmula del ejercicio 
anterior) si se permite que en los pares se dé la igualdad. 


3.2.1 Isometrías de R 


Hemos dicho que las transformaciones afines de la recta consisten de un “cambio de 
escala” (determinado por la constante a) y luego una traslación (determinada por 
b). Pero podemos ser más precisos. Como la distancia en RR se mide por la fórmula 
d (x,y) = |x — yl, podemos demostrar que todas las distancias cambian por el mismo 
factor bajo la transformación afín f (x) = ax +b: 


d(f(x),f(yj) = lax+b-— (ay + bj] =|ax — ayl 
la(x — y)! = [al |x — yl = la] d(x, y). 


! 
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Tenemos entonces una familia distinguida de transformaciones afines que son las 
que no cambian la escala, las que mantienen rígida la recta real y que llamaremos 
isometrías de RR porque preservan la métrica (la distancia). Denotemos 


Iso(1):=(f: R—R|f(x) =ax+b con lal= 1) 


(dejamos como ejercicio demostrar que es un grupo de transformaciones). 

Tenemos que Iso(1) se divide naturalmente en dos clases de transformaciones: las 
traslaciones, cuando a = 1 (y la función es entonces f(x) = x + b), que consisten en 
deslizar la recta rígidamente hasta que el O caiga en b; o bien las refleriones, cuando 
a =-—1, y que entonces se escriben g(x) =—x +b. Veámos que estas últimas tienen 
un punto fijo, es decir, un punto que se queda en su lugar bajo la transformación. 
Éste debe satisfacer la ecuación g(x) =x que es 


x=-—x+b 


y que implica x = b/2. Entonces, lo que hacen las reflexiones es intercambiar rígi- 
damente los dos lados de un punto que podemos llamar su espejo (pues por ejemplo, 
g(b/2+1) =b/2—1 y en general se tiene que g(b/2+x) = b/2— x), y de ahí el 


nombre de “reflexión”. 


EJERCICIO 3.17 Demuestra que Iso(1) es un grupo de transformaciones de R. 


EJERCICIO 3.18 Demuestra que las traslaciones de ¡R, que denotaremos Tra(1), for- 
man un grupo de transformaciones. 

EJERCICIO 3.19 Demuestra que si f € Af (1) no tiene puntos fijos (es decir, que 
f(x) % x para toda x € R), entonces es una traslación no trivial. (La trivial es trasladar 
por 0, que es la identidad y tiene a todo R como puntos fijos). 

EJERCICIO 3.20 Demuestra, usando la fórmula, que la inversa de cualquier reflexión 
es ella misma. 

EJERCICIO 3.21 Demuestra que la composición de dos reflexiones es una traslación 
del doble de la distancia (dirigida) entre sus espejos. 


3.3 Isometrías y transformaciones ortogonales 


En esta sección se estudian las transformaciones más importantes de la geometría 
euclidiana en su sentido estricto, pues son las que preservan la métrica, la noción 
de distancia y, por lo tanto, la estructura rígida de las figuras geométricas. Puesto 
que la definición general es intuitivamente nítida, partiremos de ella y deduciremos 
las propiedades básicas de las isometrías que nos llevarán, en las secciones siguientes, 
a obtener las fórmulas explícitas que las definen y que entonces nos facilitarán la 
obtención de nuevos resultados y su comprensión cabal. 
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Es importante señalar que muchos de los resultados de esta sección, así como las 
definiciones, sólo dependen de las nociones de distancia y producto interior en un 
espacio vectorial. Así que procederemos en general (para n = 1,2, 3, puede pensarse) 
y hasta el final de la sección, salvo por los ejemplos, concretaremos los resultados al 
plano. 


Definición 3.3.1 Una función f : R” — ¡R” es una ¿sometría 
Fx) si preserva distancia. Es decir, si para todo par x, y € |R” se 


d cumple que 
POS, d(x, y) = d(f(x), f(y)). 


También se les os transformaciones rígidas (aunque esta terminología no cobrará 
sentido hasta que demostremos que son biyectivas). Se denota por Iso(n) al conjunto 
de todas las isometrías de IR”. 


Nótese que la definición tiene sentido en cualquier espacio métrico, y que coincide 
para n = 1 con las de la sección anterior (3.2.1). Las isometrías mandan al espacio en 
sí mismo de manera tal que cualquier estructura rígida se mantiene. Estas funciones 
o transformaciones las vemos a diario. Por ejemplo, mover una silla de un lugar a 
otro induce una isometría si pensamos que el espacio euclidiano se puede generar y 
definir respecto de ella; el efecto de esta isometría en la silla es ponerla en su destino. 

Antes de ver más ejemplos en detalle, demostraremos tres lemas generales que 
usan solamente la definición de isometría y tienden hacia la demostración de que las 
isometrías forman un grupo de transformaciones. 


Lema 3.5 Una isometría f : RY — RR” es inyectiva. 


Demostración. Esto se debe a que la distancia entre puntos diferentes es estric- 
tamente positiva. Formalmente, supongamos que x, y € R” son tales que f(x) = 
f (y). Esto implica que d(f(x),f(y)) = 0. Como f es isometría, entonces d(x, y) = 
d(f(x),f(y)) =0 y por lo tanto x = y. O 


Lema 3.6 S5.f, g:R" —=R” son isometrías entonces g o f también lo es. 


Demostración. Usando la regla de composición y la definición de isometría dos 
veces (primero para g y luego para f), se obtiene que para cualquier x, y € RR”: 


dl(gof)(x), (go f(y)) = dlglf(x)), g(f(y))) 
) 


I 
E 
E 
se 


y por tanto g of € Iso(n). O 
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Lema 3.7 Sif € Iso(n) y tiene inversa f”!, entonces f7! € Iso(n). 


Demostración. Dados x, y € [R”, se tiene que 


af (x),f7 (y) =d(f(F" (x)),F(F" (y) 


pues f es isometría. Pero la última expresión es d(x,y), lo cual demuestra que 
f" e Iso(n). O 


Nos falta entonces demostrar que las isometrías son suprayectivas para concluir que 
Iso(n) es un grupo de transformaciones. Aunque esto sea intuitivamente claro (“una 
transformación rígida del plano no puede dejar partes descobijadas”), la demostración 
sería de momento complicada; con un poco más de técnica será muy sencilla. Así que 
vale suponer que es cierto por un rato, desarrollar los ejemplos, la intuición y la 
técnica y luego volver a preocuparnos. 


3.3.1 Ejemplos 


Ya hemos visto los ejemplos en la recta (cuando n = 1), que son traslaciones y 
reflexiones. Ejemplos en el plano serían rotar alrededor de un punto fijo, reflejar en 
una recta o bien trasladar por un vector fijo todo el plano. Estas últimas son muy 
fáciles de definir: 


Traslaciones 


Dado un vector b ER”, la traslación por b es la función 


Tb : R" => R" 
Tp(x) =x+0b, 


que claramente es una transformación (inyectiva, pues x4+-b = 
y +b > x= y; y sobre, pues 1. = T_p). Y además es una b 
isometría (Tp E Iso(n)) ya que 


d(To(x),tv(y)) = [tp(x) — Tp(y)| 
l(x+b) — (y + b)| = |x— y| = d(x, y). 


De hecho, las traslaciones forman un grupo de transformaciones de R”, al que 
denotaremos Tra(n), que puede identificarse con el grupo aditivo IR”; en lenguaje de 
grupos “son isomorfos”, pues hay una traslación por cada elemento de R”, y su regla 
de composición es claramente 


Tb O Ta = Tla+b)- 


Rotaciones 
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Definir explícitamente las rotaciones es más difícil, aunque intuitivamente sea claro 

a qué nos referimos: “clavar una tachuela en algún punto y luego rotar el plano 

alrededor de ella un cierto ángulo”. Usando coordenadas polares sí es fácil definir 

la rotación de un ángulo xx alrededor del origen, pues al ángulo de cualquier vector 

simplemente le sumamos el ángulo de rotación. Así que podemos definir la rotación 
de un ángulo « alrededor del origen como 


P, : RR 


a P.[0,r) = (O0+Q,r) (en coordenadas polares). 


Nótese que entonces Py = Pz. = id. y se cumple, como en las trasla- 
ciones, que 


Pg o Pa > Pla+B)> 


pero ahora sumando ángulos. Además son transformaciones (biyectivas, insistimos 
en ello) pues tienen inversa p,' = p_, de tal manera que las rotaciones alrededor 
del origen forman un grupo de transformaciones de R? (isomorfo al de los ángulos 
con la suma: los elementos de este grupo —+transformaciones por definición, que 
más adelante denotaremos con SO (2) — están en correspondencia uno a uno con los 
puntos del círculo unitario S' de tal manera que la composición correponde a la suma 
de ángulos). 


Ahora, usando las traslaciones podemos definir las rotaciones 
nn con centro en cualquier otro lado con un truco llamado conju- 
LA gación. Para obtener la rotación de un ángulo x con centro en 
el punto c, denotémosla con pa ¿; podemos llevar el centro € al 
origen por medio de la traslación T_¿, rotamos ahí y luego regre- 
samos a C a su lugar; es decir, podemos definir 


Pa,c = Tg oO 192% o Te. 


Aunque sea intuitivamente cristalino que las rotaciones son isometrías (se puede 
rotar un vidrio), no tenemos aún una demostración formal de ello; y con coorde- 
nadas polares se ve “en chino” pues expresar distancias (o traslaciones) en términos 
de ellas está igual de complicado. Mejor nos esperamos a tener buenas expresiones 
cartesianas de las rotaciones para demostrar que preservan distancias y que al com- 
poner dos rotaciones cualesquiera se obtiene otra (el problema por ahora es encontrar 
su centro). Y entonces veremos que junto con las traslaciones forman el grupo de 
movimientos rígidos del plano, llamados así pues se puede llegar a cualquiera de estas 
transformaciones moviendo continuamente (poco a poco) el plano. 


EJERCICIO 3.22 Demuestra formalmente (con las definiciones anteriores) que el con- 
junto de rotaciones alrededor de un punto dado € es un grupo. 
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EJERCICIO 3.23 ¿Puedes encontrar el centro de la rotación de 90% que se obtiene 
rotando 45" en el origen y luego rotando otros 45” en el punto (2,0)? (Haz dibujos —o 
juega con tachuelas y un acetato sobre un papel cuadriculado— y busca un punto que se 
quede en su lugar después de las dos rotaciones.) ¿Cuál es el centro de rotación si se invierte 
el orden de la composición? 

EJERCICIO 3.24 A partir de tu experiencia con el ejercicio anterior, y sin preocuparte 
por las formalidades, ¿puedes dar una receta geométrica para encontrar el centro de rotación 
de la composición de dos rotaciones (con centros distintos, por supuesto)? 

EJERCICIO 3.25 ¿Puedes conjeturar qué transformación es P_ab % Pace? ¿Puedes 
demostrarlo? Si no, ¿qué hace falta? 


Reflexiones 


Las reflexiones (que intercambian rígidamente los dos lados de una “línea espejo”) 
las podemos definir usando la proyección ortogonal a una recta. Dada una recta 
l CR?, se le puede definir por la ecuación normal u - x = Cc con u un vector unitario 
y Cc E R una constante (lo que habíamos llamado ecuación unitaria). Sabemos que 
para cualquier x € R? el vector que lleva a x ortogonalmente a la recta l es 


(c—u-x)u 
pues 
u-(x+ (c-u-x)u) =u-x+(c-u-x)(u-u)=c. 


Entonces, el reflejado de x en el espejo l será empujarlo otro 
tanto del otro lado de l. Así que definimos la reflexión de R? a 
lo largo de L:u-x =cC (con [ju] = 1) como 


pe : R2S R? 
prlx) =x+2(c—u-x)u. (3.3) 


Obsérvese que no nos preocupamos por las propiedades de grupo respecto a las 
reflexiones porque no lo son. Ni siquiera contienen la identidad. 


EJERCICIO 3.26 Usando coordenadas (x, y), da fórmulas más sencillas para las reflex- 
iones en los ejes coordenados y verifica que coinciden con la fórmula anterior. 


EJERCICIO 3.27 Usando coordenadas da fórmulas sencillas para las reflexiones en las 
rectas x=Yy y x= —Y. 

EJERCICIO 3.28 Usando coordenadas da fórmulas sencillas para las reflexiones en las 
rectas x= y y =C donde c es cualquier constante. 


EJERCICIO 3.29 Define reflexiones en planos de R3. 
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EJERCICIO 3.30 Demuestra que las reflexiones son isometrías. 


EJERCICIO 3.31 Demuestra que si p es una reflexión, entonces p | =p. 


EJERCICIO 3.32 Demuestra que si q. es la reflexión en la recta Ll, entonces x € R? es 
un punto fijo de y, 1.e. py (x) =x, si y sólo si x € l. 


3.3.2 Grupos de simetrías 


Supongamos por un momento (luego lo demostraremos) que las isometrías de R” 
(n = 1,2,3) forman un grupo (algo que no es difícil de creer). Entonces podemos 
definir los “grupos de simetrías” de las figuras, en el plano o de los cuerpos en el es- 
pacio, correspondiendo a nuestra intuición milenaria de lo que queremos decir cuando 
decimos que algo “tiene simetría”, por ejemplo al hablar de una flor, de un dibujo o 
de un edificio. 

Para fijar ideas, pensemos en una figura en un papel, y al papel como el plano 
R?. La abstracción más elemental es que la figura es un subconjunto F de R?: los 
puntos del plano están en F (pintados de negro) o no (de blanco como el papel). Si 
nos ponemos quisquillosos, podríamos distinguir colores en los puntos (algo que hacen 
las computadoras hoy día) y tener entonces una función y : F — (Colores) para ser 
más precisos. Pero quedémonos con el bulto, una figura F es un subconjunto de ¡R” 
(de una vez englobamos los sólidos en I¡R*). Una simetría de F (y hasta el término 
“sí-metría” lo indica) es una transformación que preserva la métrica y la figura, es 
decir una f € Iso(n) tal que f (F) = F (donde estamos aplicando la transformación a 
un conjunto para obtener un nuevo conjunto). Podemos definir entonces el grupo de 
simetrías de la figura F € R” como el conjunto 


Sim (F) :=(f € Iso(n) | f (F) =F). 


Debemos demostrar entonces que además de ser un conjunto de transformaciones 
de R” cumple con las propiedades que lo hacen un grupo; que estamos usando los 
términos con propiedad: 

i) Claramente ide» € Sim (F) pues id (F) =F. De tal manera que cualquier figura 
tiene al menos la simetría trivial; y si la figura F no tiene otra simetría diríamos 
coloquialmente que no tiene simetrías, que es asimétrica. 

ii) Supongamos que f € Sim (F); entonces al sustituir F = f (F) obtenemos que 


UA =P (EP) = (A of) (F) =id(F) =F, 


donde estamos usando nuestra suposición de que Iso(n) es un grupo y entonces que 
fl € Iso(n) ya existe. 
iii) Si f, g € Sim(F) entonces, como ninguna de las dos cambia la figura, se 
obtiene que 
(fo g) (F) =1 (9 (F)) = f (F) =F. 
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Que dice lo obvio: si un movimiento deja una figura en su lugar le podemos aplicar 
otro que la deje en su lugar y sigue en su lugar. 

De tal manera que cualquier figura o cuerpo tiene asociado un grupo de isometrías; 
qué tan grande es ese grupo es nuestra medida intuitiva de “su simetría”. Por ejem- 
plo, el cuerpo humano (abstracto, por supuesto) tiene como simetría no trivial una 
reflexión, que al ser su propia inversa forma, junto con la identidad, un grupo. Y 
ahora sí, podemos definir formalmente los grupos que esbozamos (para n > 5, y 
definimos para n = 3,4) en la primera sección de este capítulo. 


Grupos diédricos 


Consideremos el polígono regular de n lados P,, con n > 2, cuyos vértices son el 
conjunto 


[Vin := [cos (27k /n) , sen (27k/n)) |k =0,1,--- ,n—1) 


y que consiste en los segmentos entre puntos sucesivos Vx nVx+1n lla- 
mados sus caras, lados o aristas; y si se quiere se puede pensar que 
también lo de adentro es parte de P,. Definimos entonces el grupo 
diédrico de orden nm como su grupo de simetrías: 


D,, := Sim (P,). 


Es claro que D, contiene las n rotaciones en el origen Px yy que incluyen la 
identidad (k =0 o k = n). Pero además tiene reflexiones cuyos espejos son las líneas 
por el origen y los vértices y las líneas por el origen y el punto medio de sus lados (que 
para n impar ya estaban contados). En cualquier caso, son exactamente n reflexiones 
pues en nuestro conteo hubo repeticiones. De tal manera que D,, tiene 2n elementos. 

Esta clase de simetría es la que tienen los rosetones de las iglesias (por lo que 
también se les conoce como “grupos de rosetas o bien de rosetones”); muchas de 
las figuras de papel picado que se obtienen al doblar radialmente y luego cortar con 
tijeras; algunas plazas y edificios famosos y múltiples flores así como las estrellas de 
mar. 

Más cercano al “corazoncito” de este libro, podemos considerar las cónicas. Sea, 
€ la elipse dada por la ecuación canónica 


con a > b (aunque lo que importa es que a % b). Es claro por el dibujo que las 
simetrías de € son las reflexiones en los ejes. Pero lo podemos demostrar formalmente 
pues, como se debió haber respondido al ejercicio correspondiente, la reflexión en el 
eje x está dada por la fórmula 


px (x,y) = (x, —y) - 
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Y análogamente, la reflexión en el eje y es y (x,y) = 
A (=x, y), de tal manera que su composición (en cualquier or- 
den) es la rotación de 7t en el origen ((x,y) + (—=x, —y)). 
Si el punto (x,y) está en la elipse, satisface la ecuación y 
entonces los otros tres puntos que se obtienen al cambiar el 
signo a una o a las dos coordenadas también la satisfacen 
pues cambiar el signo no afecta los cuadrados. Esto implica 
que € va en sí misma al reflejar en cualquiera de los ejes, 
que en adelante llamaremos sus ejes de simetría. Falta ver 
que no tiene ninguna otra simetría y esto se sigue de que su 
diámetro (el segmento máximo entre sus puntos, que mide 2a) es único. Y puesto 
que D, es, por definición, el grupo de simetrías de un segmento, entonces 


Sim (€) = D,. 


Análogamente, el grupo de simetrías de una hipérbola es el diédrico de orden 2. 
Las parábolas tienen menos simetrías, sólo una reflexión, que junto con la identidad 
forma un grupo que podemos llamar D, para completar la definición de los diédricos 
(finitos). Nótese que este tipo de simetría (el de una sola reflexión, junto con la 
identidad) es muy común, el cuerpo humano (en abstracto, por supuesto), casi todos 
los animales, una silla, etcétera. 


Grupos cíclicos 


Son el subgrupo del diédrico correspondiente que consiste en tomar únicamente las 

rotaciones. Pero lo importante es que también son grupos de simetría de figuras. 
Para obtener una, podemos reemplazar las aristas del polígono P,, por 
curvas que distingan entre salida y llegada, por ejemplo, un símbolo 
de “integral” para obtener a la “estrella ninja de n picos” E,. Y 
entonces el grupo cíclico de orden n es 


Cas Sim(E,]. 


n 


El grupo cíclico de orden n, C,,, tiene n elementos. Se puede iden- 
tificar con el grupo de residuos módulo n, denotado con Z.,, donde la composición 
corresponde a la suma. 

Parece que el gran Leonardo da Vinci notó que cualquier figura plana que se pueda 
dibujar en una hoja de papel (traducida a una figura F CR? acotada) y que no tenga 
todas las simetrías de un círculo (que no sea un conjunto de anillos concéntricos) 
tiene como grupo de simetrías a alguno de estos dos tipos; es decir, o es diédrico o 
es cíclico. Una versión de este resultado la demostraremos hacía el final del capítulo, 
aunque desde ahora se puede entender su enunciado. Dice que si G es un grupo de 
isometrías que, como conjunto, es finito, entonces es cíclico o es diédrico; que con 
estos dos ejemplos ya acabamos. 
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Sin embargo, hay otros grupos de simetría interesantes. Si pensamos en figuras no 
acotadas; por ejemplo, una cuadrícula o un mosaico (un cubrimiento del plano con 
copias de unas cuantas piezas), M digamos, entonces Sim (M) es lo que se llama un 
grupo cristalográfico. De estos solamente hay 17, pero no lo demostraremos en este 
libro. 


Diédrico y cíclico infinitos 


Para entender el porqué del nombre en sus versiones infinitas, vale la pena retomar 

la idea de generadores de un grupo usada en la primera sección. Para generar una 
figura con simetría diédrica (que quizá, como veremos, debía llamarse 5Ó 
caleidoscópica) basta poner dos espejos en un ángulo 1/n y colocarlos 
sobre cualquier dibujo; la porción de éste que queda entre ellos se 
“reproduce” caleidoscópicamente y forma alrededor de la arista donde Ja 
se juntan los espejos una figura con simetría D,,. 


eS 


Consideremos esta situación en el plano del dibujo. Sean a y f las reflexiones en los 
dos espejos (que ahora son líneas en el plano y los espejos verdaderos son los planos 
que emanan perpendicularmente de ellas) y sea F la figura 


0 que queda en el ángulo relevante. La figura a (F) tiene la ori- 
entación contaria a F, es un reflejado de ella. 
F Al volverla a reflejar en f (a (F)) esta nueva Bla(P)) 


Ja copia de F ya tiene la orientación original y 

se obtiene rotando a F el doble del ángulo en- 
a(F) tre los espejos, a saber, 2711/n alrededor de su Y 
punto de intersección. Pero esto no se cumple 


sólo para la figura F: es una propiedad de las F 
transformaciones, es decir, (f3 o ax es dicha rotación. La composición Ya 
en el otro orden, xo f3, resulta ser la rotación inversa (de —211/n en 
el punto de intersección). Así, a cada copia o imagen de la figura F a(E) 


que se ve en el ángulo de espejos corresponde un elemento del grupo 

diédrico que es justo la transformación que lleva a F ahí y que se obtiene componiendo 
sucesivamente las dos reflexiones originales « y f. La figura con simetría diédrica o 
caleidoscópica que se genera es la unión de todas estas copias (justo 2n) de lo que se 
podría llamar la figura fundamental que habíamos denotado F. 
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Hemos visto que, como en los casos n = 3,4, los 
grupos diédricos están generados por dos reflexiones; a 
saber, D,, está generado por dos reflexiones cuyos espejos 
se encuentran en un ángulo 1/n (en las figuras tomamos 
n = 6). ¿Qué pasa si hacemos crecer n? Es claro que la 
figura fundamental F tenderá a hacerse más flaca y astil- 
lada, mientras que la figura caleidoscópica que generan 
(F y las reflexiones a y f), que 
podemos denotar D,, (F), pues re- e 
sulta natural definir A y0 


Ja 


se hará más pesada y confusa, pues el ángulo 11/n disminuye. Sin embargo, podemos 

evitar este tumulto si al mismo tiempo que n crece y 1 /n disminuye, alejamos el punto 

de intersección de los espejos; es decir, podemos girar uno de 

los espejos (el correspondiente a f, digamos) alrededor de algún 

sopas punto fijo y esto produce que el punto de intersección se aleje. 

La figura D,, (F) que se genera entonces es un anillo cuyo radio es 

grande: es como esos pasillos circulares que se generan en un baño o closet con espejos 

encontrados pero no perfectamente paralelos; aunque los espejos se acaben, los planos 

que definen se intersectan en una línea (imaginaria) 

que es el eje, el centro, del pasillo circular donde 

están nuestras imágenes viendo alternadamente en 
ambos sentidos y girando poco a poco. 
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Desde luego, este proceso tiene un limite: cuando n tiende a infinito el espejo 
de f llega sin problemas a una paralela al espejo de ax; y en ese mo- 
Sy) J6 mento generan el grupo diédrico infinito Do. Es el grupo que aparece 
Ja en las peluquerías donde ponen espejos en paredes 
opuestas y, en teoría, paralelas. Cada elemento de E 
este grupo es una composición (palabra) del estilo afaf --- Ba, 
aunque puede empezar y terminar con cualesquiera de x o (3. El 
subgrupo que consiste de palabras pares (incluyendo a la vacía que 
representa la identidad), que son composición de un número par de 
reflexiones, es el cíclico infinito, C.,: consta de puras traslaciones 
y está generado por la más chica de ellas: xf o Ba, da lo mismo. 
De tal manera que naturalmente se identifica con los enteros (Z) y 
la suma corresponde a la composición. 


Pero el grupo diédrico infinito, como la figura con su simetría 
lo indica, realmente vive en la recta. Cualquier par de reflexiones 
distintas en Iso(1) lo generan. Y si lo definimos como subgrupo 
de isometrías de R?, fue porque gráficamente es más fácil de ver y 
para justificar la naturalidad de su pomposo nombre. 


Nótese, por último, que aunque al escoger distintas reflexiones para generar el 
diédrico infinito (o cualquiera de los finitos, para este caso) se pueden obtener sub- 
conjuntos (estrictamente) distintos de isometrías, pero la estructura algebraica de 
ellos (cómo se comportan bajo composición) es esencialmente la misma. De tal man- 
era que los grupos diédricos y cíclicos que hemos definido deben pensarse como algo 
abstracto que tiene muchas instancias de realización geométrica. Así que, estricta- 
mente hablando, cuando decimos que el grupo generado por tal par de reflexiones es 
el diédrico fulano, realmente deberíamos decir “es un diédrico de zutanito orden”. 


EJERCICIO 3.33 Sean a y f las dos reflexiones de R con espejos en el 0 y en el 
l respectivamente, y sea (para este y los siguientes ejercicios) Do, C Iso(1) el grupo de 
transformaciones que generan ax y f. Da las fórmulas explícitas de x, B, xo fB, Boa y 
xo Bo. 


EJERCICIO 3.34 ¿Cuál es el grupo DN Tra(1)? Da la fórmula explícita de todos sus 
elementos y su correspondiente expresión como generado por x y f. (El próximo ejercicio 
te puede ayudar.) 


EJERCICIO 3.35 Demuestra que las reflexiones en D,¿, son precisamente las reflexiones 
con espejo entero. Es decir, cuyo espejo está en Z=(... —2,-1,0,1,2,...) CR. 


EJERCICIO 3.36 ¿Cuáles son los generadores del grupo diédrico infinito cuyo subgrupo 
de traslaciones corresponde precisamente a las traslaciones por números enteros Z. 


ya) P 
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3.3.3 Transformaciones ortogonales 


Hemos definido isometrías, visto los ejemplos básicos y desarrollado la importante 
noción de simetría —y no sólo importante en las matemáticas sino en la naturaleza 
donde parece ser muy abundante—, pero tenemos aún muy pocas herramientas téc- 
nicas para demostrar cosas tan elementales como que Iso(n) es un grupo. Para 
esto serán fundamentales las transformaciones ortogonales. Pero su motivación más 
natural viene de recapitular cómo introdujimos la noción de distancia: como una 
consecuencia natural del producto interior que era más elemental y fácil de trabajar; 
y a éste lo hemos tenido olvidado. Si las isometrías se definieron como las funciones 
que preservan distancia, algo similar se debe poder hacer con el producto interior. 


Definición 3.3.2 Una función f : RY — R” es una transformación ortogonal si 
preserva el producto interior. Es decir, si para todo par Xx, y € IR” se cumple que 


x- y =1(x) -f(y). 


Se denota por O(n) el grupo de transformaciónes ortogonales de IR”. 


El lector observador debió haber notado que nos estamos adelantando al usar 
los términos “transformación” y “grupo” en la definición anterior. Estrictamente 
hablando, deberíamos usar los términos más modestos de “función” y “conjunto”, 
pero como sé (autor) que sí va a tener sentido, vale la pena irse acostumbrando; 
además, en este caso me suenan horrible los términos modestos , no me hallo usándo- 
los. Por lo pronto, para limpiar un poco la conciencia, dejamos al lector quisquilloso 
que cumpla los primeros trámites hacía la “liberación total” de los términos ver- 
daderos. 


EJERCICIO 3.37 Demuestra que la composición de funciones ortogonales es ortogonal. 


EJERCICIO 3.38 Demuestra que si una función ortogonal tiene inversa entonces ésta 
también es ortogonal. 


EJERCICIO 3.39 Demuestra que O(1) = [idr, —idr), donde (—idr) (x) = —x. Re- 
cuerda que el producto interior en IR es el simple producto. Observa que entonces las 
transformaciones ortogonales de ¡R son sus isometrías que dejan fijo el origen. 


Antes de entrar a las demostraciones, veamos un ejemplo que nos ha sido muy 
útil, el compadre ortogonal en R?. Hemos usado al compadre ortogonal de un vector 
dado, pero, como lo indicamos en el momento de su presentación, si 
pensamos en todas las asignaciones al mismo tiempo obtenemos una 
función de R? en R?, que podemos designar como p : RR? — R? y que 
está dada por la fórmula explícita 


(2,y) 


p (x, y) =- (—y, Xx) + 
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Para demostrar que el compadre ortogonal es una transformación ortogonal (valga y 
explíquese la redundancia), hay que escribir la fórmula para p (x) - p (y) con (conviene 
cambiar a subíndices) x = (x1,x2) y y = (y1,42) cualquier par de vectores: 


p(x)-p(y) = (=x2,x1) - (—y2,41) 


(2) (+42) + x141 
= X1Y1 + X2Y2 =X-:Yy 


(de hecho esto fue el inciso (iii) del Lema 1.12 que presentaba sus monerías en so- 
ciedad). Si el compadre ortogonal que, como función, consiste en girar 90” alrededor 
del origen es ortogonal, es de esperarse que todas las rotaciones en el origen también 
lo sean, y así será. Pero antes, relacionemos las transformaciones ortogonales con las 
isometrías. 

Puesto que la distancia se define en términos del producto interior, debe cumplirse 
que una función ortogonal también es isometría. 


Lema 3.8 O(n) C Iso(n). 


Demostración. Sea f € O(n). Debemos demostrar que preserva distancias sabiendo 
que preserva producto interior. Pero esto es fácil pues la distancia se escribe en 
términos del producto interior. Dados x y y en RR”, la definición de distancia es 


d(x,y) = y (x— y) : (x— y). 
Al elevar al cuadrado y usar las propiedades del producto interior se tiene entonces 
d(x, y) =x-x+y:y —2x-y. (3.4) 


Como esto se cumple para cualquier par de puntos, en particular para f(x) y f(y), 
tenemos 


d(f(x),f(y)? = f(x) f(x) +1(y) - f(y) — 2f(x) -f(y) 
X-X+Yy:y-—2x-y 
= d(x,y), 


donde usamos que f € O(n) en la segunda igualdad. Puesto que las distancias son 
positivas, de aquí se sigue que 


d(f(x), f(y)) = d(x, y), 


y por tanto que f € Iso(n). O 


EJERCICIO 3.40 Demuestra que las funciones ortogonales son inyectivas. 


Dibujo 
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Ahora veremos que lo único que le falta a una isometría para ser ortogonal es 
respetar el origen. Para que tenga sentido, hay que remarcar que una función ortog- 
onal f € O(n) preserva el origen pues éste es el único vector cuyo producto interior 
consigo mismo se anula, es decir, f(0) - f(0) =0.0=0 f(0) =0. 


Lema 3.9 Sea f € Iso(n) tal que f(0) =0, entonces f € Ol(n). 


Demostración. Con la misma idea del lema anterior, hay que escribir ahora el 
producto interior en términos de distancias. De la ecuación (3.4), se sigue 


1 
xy =>3(x ox + y y dx, y)”. 


Y como x - x = d(x, 0)?, tenemos entonces 
1 
xy = 3(4(x,0) + d(y,0 — d(x, y) 


y ya estamos armados para enfrentar el lema. 
Sea f € Iso(n) (preserva distancias) tal que f(0) = 0. Por lo anterior, se obtiene 


10) -f(y) = S1at100,07 + a(fíy),0? —a(109,1y)Y) 
= (att), 110) + af), FO)? — at, 14) 
= (a(x,0) + a(y, 0? — díx,y)”) 
= XV: 


O 


Estamos ya en posición de expresar todas las isometrías en términos de las ortog- 
onales y las traslaciones. 


Proposicion 3.10 Sea f € Iso(n). Entonces existen yg € O(n) y b ER” tales que 
para toda x € R" 


y además son únicas. 


Demostración. Veamos primero la unicidad, es decir, que si suponemos que existen 
g € O(n) y b € R” tales que f se escribe f (x) = g (x) + b, entonces g y b están 
forzadas. Puesto que las transformaciones ortogonales dejan fijo el origen, obtenemos 
que 


f(0) =g(0)4b=0+b=b, 
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y entonces la constante b está forzada a ser b := f(0). Pero entonces g ya queda 
definida por la ecuación 


para toda x € IR”. Nos falta entonces demostrar que con esta última definición de la 
función g y el vector constante b € R” se cumple que g es ortogonal. 

Observése que otra manera de definir a g sería g = T_y0f, donde hay que recordar 
que T_p €s la traslación por —b. Por el Lema 3.6 (la composición de isometrías es 
isometría) y puesto que las traslaciones son isometrías, se obtiene que g € Iso(n). 
Pero además, como 


g(0) =f(0)-b=b-—b=0, 


entonces g € O(n) por el lema anterior y la existencia queda demostrada. O 


Tenemos entonces que las isometrías se obtienen de las transformaciones ortog- 
onales al permitir que interactúen, que se involucren, que se compongan, con las 
traslaciones (que no son ortogonales, de hecho sólo se intersectan en la identidad, 
O(n) N Tra(n) = (id), pues la única traslación que deja fijo el origen es por 0). Cor- 
responde esto al hecho de que la distancia se obtiene del producto interior trasladando 
un punto al origen. Y por tanto, para acabar de entender Iso(n) debemos estudiar 
O(n). Como en un ejercicio ya establecimos el caso de O(1) = (1, —1), concentré- 
monos en O(2). 

Sea f € O(2). Como f preserva el producto interior, también preserva la norma y 
en particular manda al círculo unitario S' en sí mismo: 


xeS >x.x=1>f(x) f(x) =1> f(x) es'. 


Pero también preserva ortogonalidad (definida con base en el producto interior). En- 
tonces debe mandar bases ortonormales en bases ortonormales. 'Veámoslo con el 
ejemplo más simple. 

Sean ey, ez la base canónica de ¡R?; es decir es = (1,0) y ez = (0,1). Y sean 


Afirmamos que u y v son una base ortonormal, pues de que f € O(2) (preserva 
producto interior) se obtiene 


uu=e¡.e=1 
v.v=e:ez=1 
u.v=e¡-ez=0. 


Dibujo 


Dibujo 


Dibujo 
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Y entonces podemos encontrar el valor de f(x) para cualquier x usando el teorema 
de las bases ortonormales (Teorema 1.23) sobre f(x): 


f(x) = (f(x) - uJu + (f(x) - v)v 
= (f(x) -f(e1))]u + (f(x) - f(e2))v 
= (x - e, Ju + (x - e2)v, 


que se puede escribir, tomando como de costumbre x = (x, y), como 
f(x, y) =xu+yv. (3.5) 


Hemos llegado entonces a una fórmula explícita para las funciones ortogonales (de 
R2) que depende únicamente de sus valores en la base canónica. Por ejemplo, si f 
fuera la función “compadre ortogonal”, entonces u =f (e) = e, y v=f(e,) = —e; 
y por lo tanto f(x,y) =x e, —ye¡ = (—y,x) como ya sabíamos. Podemos resumir 
con la: 


Proposicion 3.11 Sif € O(2), existe una base ortonormal u, v de R? para la cual 
f se escribe 


f(x, y) =xu+yv. 


De aquí podemos sacar por el momento dos resultados: el primero, que estas 
funciones ortogonales son suprayectivas (y por lo tanto que ya les podemos decir 
“transformaciones” y a O(2) “grupo” con todas las de la ley); y el segundo, que es 
una descripción geométrica de todas ellas. 

Primero, con la notación de arriba, dado cualquier y € R?, es fácil encontrar x 
tal que f(x) = y. Sea x := (y - u)e¡ + (y - vje,, entonces 


f(x) = (x - e¡Ju+ (x - e2)v 
= (y - u)Ju+ (y - v)v=y 


por el Teorema 1.23, y esto demuestra que f es sobre. 

Segundo, cuántas transformaciones (¡ahora sí! sin pruritos) ortogonales de R? hay 
es equivalente a cuántas bases ortonormales podemos escoger. El primer vector u (la 
imagen de ey, insistamos) puede ser cualquiera en el círculo unitario S!; pero una vez 
escogido ya nada más nos quedan dos posibilidades para escoger el segundo, pues éste 
debe ser perpendicular y unitario. Puede ser el compadre ortogonal (v=u*) o bien 
su negativo (v= —u”). En el primer caso, la transformación resulta ser una rotación 
que manda a la base canónica ey, e en la base rotada u, u*. Y en el segundo caso 
veremos que es una reflexión. Podríamos decir entonces que O(2) “consiste en dos 
copias” de S! parametrizadas por u: una corresponde a las rotaciones (cuando se 
escoje v =u“) y la otra a las reflexiones. 

Pero para que todo esto sea un hecho nos falta demostrar que sin importar que 
base ortonormal tomemos, siempre se obtiene una transformación ortogonal. 
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Proposicion 3.12 Sea u, v una base ortonormal de ¡R?. Entonces la función f : 


R? => R?, definida por 


f(x, y) =xu+yv, 


es una transformación ortogonal. 


Demostración. Sean x = (x1,x2) y y = (y:,y2) cualquier par de puntos en IR?. 


Entonces 


f0)-fly) = (q u+xv)- (y u+yv) 


= (x1y1)u-u+ (x2y2) vv + (x1Y2 + x2Y1) uv 
= X1Y1 + X2Y2 =X:Y. 


EJERCICIO 3.41 Demuestra que las isometrías de ¡R? son suprayectivas, para concluir 
con la demostración de que Iso(2) es un grupo de transformaciones. 


EJERCICIO 3.42 Demuestra que las funciones ortogonales de R3 son suprayectivas y 
concluye las demostraciones de que O(3) e Iso(3) son grupos de transformaciones. 


EJERCICIO 3.43 Sea f € O (2) con base ortonormal asociada u, v (es decir, con u = 
f(e1) y v=f(e>)). Con nuestra demostración de la suprayectividad de f se puede encontrar 
la base ortonormal asociada a la inversa de f, llamémosla u', v/. Da sus coordenadas 
explícitas tomando u = (uy, u2z) y v= (v],vz). 

EJERCICIO 3.44 Seanf € O (2) y l una recta dada por la ecuación n-x =C. Demuestra 
que f (() es la recta dada por la ecuación f(n).x = c (ojo: tienes que demostrar dos 


contenciones). Concluye que f manda al haz paralelo con dirección d en el haz paralelo con 
dirección f (d). 


Un ejemplo 


Para fijar ideas, concluyamos esta sección con un ejemplo que nos ayude a comprender 
el poder de los resultados obtenidos. 


Sea f : 


2 = 


R? la rotación de 45? (o 7/4) alrededor del punto p = (3,2); el 


problema es escribir una fórmula explícita para f. Es decir, supongamos que queremos 
dar la función a una computadora para que haga algo con ella, que sepa aplicarla a 
puntos concretos; no le podemos dar la descripción que acabamos de hacer (y que 
cualquier ser humano entiende) para definir f, sino que tiene que ser mucho más 
concreta: una fórmula analítica. 

Por la Proposición 3.10, sabemos que f se escribe como 


f(x) = g(x) + b, 


Dibujo 
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para alguna g € O(2) y alguna b € R?. El problema se divide entonces en dos: 
cómo se escribe g y quién es b. Primero, g debe ser la rotación de 71/4 en el origen 
pues f cambia las líneas horizontales en líneas a 45” y en la expresión anterior sólo 
g puede hacer esta gracia (pues una vez que apliquemos g la traslación mantendrá 
la orientación de las líneas). Por la Proposición 3.11, para expresar g basta ver que 
le hace a la base canónica e,, e, y sabemos que tiene que ir a u, u*, donde u es el 
vector unitario a 45”. Es decir, sea 


y entonces por (3.5) g se escribe 


! 
e 
e 
AÑ 
«C 
E 


g(x, y) 


y esto sí que lo entiende una computadora. Para convencernos de que vamos por buen 
camino basta checar que efectivamente esta fórmula da g(e;) =u y g(ez,) = u”; e 
inclusive que g(u) = e, como dice la geometría. 

El segundo problema es encontrar b. Sabemos por la demostración de la Proposi- 
ción 3.10 que b =f(0). Y entonces bastará encontrar este valor particular. Esto se 
puede razonar de varias maneras, pero lo haremos de manera muy general. Recordemos 
que definimos rotar en el punto € como trasladar € al origen, rotar ahí y luego regresar 
c a su lugar. En términos de funciones esto se escribe 


=T0 90 TZ 


donde T, es la traslación por Xx. De aquí se podría sacar directamente la fórmula 
para f pues ya sabemos expresar g y las traslaciones, y falta nada más desarrollar las 
expresiones; o bien, podemos sólo aplicar esto al 0: 


b 


f(0) = (T,¿ogoT_¿) (0) 
= (T¿og)(0— e) = Tel g[—c)) = g[—e)+e 


dl=s¿=21P(8,21:= (=l;=3)18,2) 
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De ahí concluimos que la expresión analítica de f es 


f(x,y) = glx,y)+*(0) 
1 1 1 
= qe U,X A y) T (3 Ao 


1 
= 77 Y 1 +32, 0454242). 


EJERCICIO 3.45 Encuentra la expresión analítica de las siguientes isometrías: 

a) La reflexión en la recta l:x+y=1. 

b) La rotación de 711/2 en el punto (-2, 3). 

c) La rotación de 71 en el punto (4,3). 

d) La reflexión en la recta l : y =1 seguida de la traslación por (2, 0). 

EJERCICIO 3.46 Describe geométricamente (con palabras) las siguientes isometrías: 
a) f(x,y) = (x+1,—y). 

b) f(x, y) = (=x +2, —y). 

c) f(x,y) = (—y, -x +2). 


3.4 Las funciones lineales 


Hemos visto que las transformaciones ortogonales de R? quedan determinadas por lo 
que le hacen a la base canónica; es decir, que se escriben 


f(x,y) =xu+uyv, 


donde u y v son vectores fijos (u = f(e,) y v= f(e2), bien por definición o bien por 
la fórmula); y además, vimos que si la función es ortogonal entonces u y v forman una 
base ortonormal. Pero si en esta fórmula no pedimos nada a u y a v, simplemente 
que sean vectores cualesquiera en IR?, obtenemos una familia de funciones mucho más 
grande: las lineales de R? en R? (ver el siguiente teorema). Estas funciones son la 
base del álgebra lineal y serán el fundamento para las transformaciones que más nos 
interesan, así que vale la pena definirlas y estudiarlas un rato en general. 


Definición 3.4.1 Una función f : R" — R'" es lineal si para todos los vectores X, 
y ER” y todo número t € R se cumple que: 


i) f(x+y) =f(x) +1(y) 
107 Hi EN O: 


Estas funciones, al preservar la suma y la multiplicación por escalares, conservan 
las operaciones básicas de un espacio vectorial y por eso son tan importantes. Pero 
en el caso que nos ocupa, tenemos el siguiente teorema. 


Animacion 
Interactiva 
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Teorema 3.13 Una función f :R? — R? es lineal, si y sólo si se escribe 


f(x,y) =xu+yv, 


donde u y v son vectores fijos en R?. 


Demostración. Supongamos que f : R? — R? es lineal y sean u := f(e¡) y v := 
f(e>), donde, recuérdese, e; = (1,0) y ez = (0,1) son la base canónica de R?. Dado 
cualquier x € R?, tenemos que si x = (x,y) entonces x = xe¡ + y e», de donde, 
usando las propiedades (i) y (1i) respectivamente, se obtiene 


fíxy) = f(x) =f(xe1+v€)2) 
= flxe¡)+f(y ez) 

xtf(e1) +yf(e,) 

= xu+uyv. 


Lo cual demuestra que cualquier función lineal se expresa en la forma deseada. 

Por el otro lado, veamos que la función f(x,y) =xu+uyv, con u y v arbitrarios, 
es lineal. Cambiando la notación de las coordenadas, sean x = (x1,x2) y y = (y1,Uz2). 
De la definición de f y las propiedades elementales de la suma vectorial tenemos 


fíx+y) = f(x +41, +2) 
= (a +41) u+ (a +42) v 
= (x U+x2vV) + (y U+y2v) 
= f(x)+f(y), 


lo cual demuestra que f cumple (i). Análogamente, f cumple (ii), pues para cualquier 
teR 


f(tx) = (tx1) u + (tx>) v 
t(x1 u + x2v) =t(f(x)). 


Lo cual concluye la demostración del teorema. Ol 


Tenemos entonces que las transformaciones ortogonales son funciones lineales, así 
que ya hemos visto varios ejemplos. Pero son muchas más las lineales de I¡R? en R? 
que las ortogonales (véase el Ejercicio 3.50). Si tomamos la cuadrícula canónica con 
verticales y horizontales en los enteros de los ejes, una transformación lineal la manda 
en la “rombícula” que generan los vectores imágenes de la base canónica y que consiste 
en tomar las paralelas a uno de ellos que pasan por los múltiplos enteros del otro. 
Sólo cuando esta rombícula se sigue viendo como cuadrícula, y del mismo tamaño, 
tenemos una transformación ortogonal. Pero además, nótese que hemos definido 
funciones lineales entre diferentes espacios vectoriales y que en la demostración del 
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teorema no tuvimos que explicitar en dónde viven u y v. Si vivieran en R*, por 
ejemplo, la imagen sería la misma, un plano rombiculado, que tiene la libertad extra 
de bambolearse. 


EJERCICIO 3.47 Demuestra que una función f : R” — R' lineal preserva el origen, es 
decir, que cumple f(0) =0. 

EJERCICIO 3.48 Demuestra que una función lineal manda líneas en líneas (de ahí su 
nombre) o a veces en puntos. 

EJERCICIO 3.49 Demuestra que la composición de funciones lineales es lineal. 
EJERCICIO 3.50 Demuestra que la función f : R? — R?, definida por f(x, y) =xu+yv 
es ortogonal si y sólo si Uu, v forman una base ortonormal. 

EJERCICIO 3.51 Demuestra que la función f : R — R definida como f(x) = 3x es una 
función lineal. 

EJERCICIO 3.52 Demuestra que una función f : R — R es lineal si y sólo si es la 
función f(x) = ax para alguna a € R. 

EJERCICIO 3.53 Demuestra que la función f : R — R? definida como f(x) = (3x,5x) 
es una función lineal. 

EJERCICIO 3.54 Demuestra que una función f : R — R? es lineal si y sólo si se escribe 
f(x) = (ax, bx), para algunos a, bE R. 

EJERCICIO 3.55 Demuestra que la función f : R? — R definida como f (x,y) =2x+4y 
es una función lineal. 

EJERCICIO 3.56 Demuestra que la función f : R? — R? definida como f(x,y) = 
(x+uy,y — Xx) es una función lineal. 

EJERCICIO 3.57 Exhibe una función lineal f : R? — R? que mande el eje x a la recta 
(:2x—y=0. 

EJERCICIO 3.58 Demuestra que una función f : RÍ —> R” es lineal, si y sólo si se 


escribe 
f(x, y, 2) =xU+yv+zw, 


donde u =f(e,), v=f(e2) y w =f(e3). 


3.4.1 Extensión lineal 


De los ejercicios anteriores, en particular el último, debe quedar claro que el Teo- 
rema 3.13 es sólo un caso particular de un resultado general que haremos explícito 
en esta sección. Aunque estemos especialmente interesados en las dimensiones 1,2, 3, 
para ocuparnos de todas ellas a la vez, y evitarnos el molesto trabajo de 6, seis, casos 
particulares, es necesario trabajar con los abstractos ¡R” y RR”. 


Como definimos en el capítulo 1, dados los vectores v¡,V2,...,Vx en ¡R”, una 
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combinación lineal de ellos es el vector 


k 
ys AV; € Ro, 
i=1 


donde A; € R, i= 1,...,k, son escalares cualesquiera llamados los coeficientes de la 
combinación lineal. Por ejemplo, todas las combinaciones lineales de un solo vector 
(k = 1) forman la recta que genera (si es no nulo) y las de dos vectores forman un plano 
(si no son paralelos). En una combinación lineal se están utilizando simultáneamente 
las dos operaciones básicas de un espacio vectorial. Ahora bien, si tenemos una 
función lineal f : R" —= R'Y, se cumple que preserva combinaciones lineales pues 


k k k 
T() Av; = > F(Arvi) => Af (vi), 
el ? 


donde se usa la propiedad (i) de las funciones lineales en la primera igualdad y la (ii) 
en la segunda. Así que podemos redefinir función lineal como aquella que cumple 


[E Mv) = E Mw), (3.6) 
i=1 


i=1 


para cualesquiera V¡,V2,...,Vx ER” y A1,A2,...,Ax € R; pues esta condición clara- 
mente incluye la (i) y la (ii) de la definición original. Hay que hacer énfasis en que 
en esta igualdad la combinación lineal de la derecha se da en RR” (el codominio), 
mientras que la que tenemos en el lado izquierdo ocurre en R” (el dominio), antes de 
aplicarle la función, que no necesariamente son el mismo espacio. 

Por otro lado, ¡R” tiene una base canónica: los vectores e; = (1,0,...,0), ez = 
(0,1,...,0),...,€n = (0,0,..., 1); es decir, para i = 1,...,n el vector e; € R” tiene 
i-ésima coordenada 1 y el resto 0. Estos se llaman canónicos pues la combinación 
lineal de ellos que nos da cualquier otro vector x = (x1,X2,...,Xn) € R” se obtiene 
trivialmente (“canónicamente”) de sus coordenadas: 


n 
ESPESA a) = yA e. 
i=1 


De tal manera que para cualquier función lineal f que sale de R” se tiene, usando 
(3.6) y esta última expresión, que 


tapo) ote: 
i=1 


Nos falta ver que los valores que puede tomar f en la base canónica son arbitrarios. 
Es decir, si tomamos n vectores U¡,Uz,..., Un E IR” arbitrariamente, y queremos 
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encontrar una función lineal f : RR” —> R” que cumpla f(e;) = u; parai=1,2,...,n, 
entonces debemos definirla en todo R” como 


n 
f (x1,X2, ca) = Y x u;. 
i=1 


A esta función se le llama la extensión lineal a R” de lo que determinamos para la base 
canónica. Pero nos falta demostrar que efectivamente es lineal. Sin embargo, esto 
es muy fácil de hacer usando la definición original de función lineal y las de suma y 
multiplicación por escalares; hay que copiar la del Teorema 3.13 con más coordenadas, 
y dejamos este trabajo al lector. Podemos resumir entonces con el siguiente teorema. 


Teorema 3.14 Una función f : ¡R” — R' es lineal si y sólo si se escribe 


n 
f(x1,%2, Xp) =%1 Uy +87 +>> ++ Xp Un = Y xi 0, 


i=1 


donde u;,u,... Un, ER”. Nótese que u; =f(e;). O 
Corolario 3.15 5 f:¡R" —=R" yg: RR” — R'” son dos funciones lineales tales que 
f(e¡) = g(e;) parai=1,2,...,n, entonces f(x) = g(x) para toda x € R”. 

Demostración. Por el teorema, tienen la misma expresión. O 


El teorema, o bien su corolario, pueden llamarse “Teorema de extensión única de 
funciones lineales”. La moraleja es que una función lineal depende únicamente de 
unos cuantos valores: los que le asigna a la base canónica, y éstos, una vez fijado el 
codominio, son arbitrarios. 


EJERCICIO 3.59 Describe el lugar geométrico definido como £ = (f(x) : x € R), donde 
f : R > RY es una función lineal. 

EJERCICIO 3.60 Describe el lugar geométrico definido como TT = (f(x) : x € R?), 
donde f : R? — RÍ es una función lineal. 

EJERCICIO 3.61 ¿Qué ejercicios del bloque anterior se siguen inmediatamente del 
Teorema 3.147? Reescríbelos. 


3.4.2 La estructura de las funciones lineales 


En el capítulo 1 dejamos en suspenso un ejercicio donde se pregunta al lector si 
conoce algún otro espacio vectorial que no sea IR”. Sería desleal dejar pasar ese 
ejemplo cuando lo tenemos en las narices. Efectivamente, cuando fijamos el dominio 
y el contradominio, las funciones lineales entre ellos tienen naturalmente la estructura 
de un espacio vectorial. 
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Fijemos la notación. Sea L£(n,m) el conjunto de todas las funciones lineales de 
RY a JR”, es decir 


L(n,m) =[f: R" —= R” | f es lineal) . 


Como en el codominio se tienen las operaciones de suma y multiplicación por escalares, 
estas Operaciones se pueden definir también en las funciones; en cierta manera, las 
funciones las heredan. Dadas f, g € L(n,m) y t € R, sean 


f+g:R" — R” 
(f+ 9) (x) := f(x) + g(x) 


tf:RT—>R" 
Mt := too: 


Hay que demostrar que estas nuevas funciones también son lineales. Y esto es 
muy fácil a partir de la definición original, pues dados x,y €R” y A, ue R, 


(f+9)Mx+uy) = f(Ax+uy) + g(Ax + uy) 
M(x) + uf(y) + Aglx) + ugly) 
Af(x) + g(x)) + ul fly) + gl(y)) 
= Mf+9)(x) + u(f + 9)(y). 


Formalmente nos falta demostrar que estas operaciones cumplen todas las propiedades 
que se les exigen a los espacios vectoriales (el Teorema ??). Esto depende esencial- 
mente de que R'" es espacio vectorial (no de que sean funciones lineales) y dejamos los 
detalles como ejercicio lateral (no esencial) a la línea del texto. Los nuevos ejemplos 
de espacio vectorial son entonces los conjuntos de funciones que salen de algún lugar 
(con alguna propiedad —el caso que desarrollamos fue que son lineales—) pero que 
caen en un espacio vectorial (en nuestro caso, R'). 


EJERCICIO 3.62 Sea V un espacio vectorial y sea X cualquier conjunto. Demuestra 
que el conjunto de todas las funciones de X en V, F(X, V), tiene una estructura natural de 
espacio vectorial. (En particular L(n, m) es un subespacio vectorial de F(R”, RM) que es 
inmensamente más grande.) 


EJERCICIO 3.63 Sea Ay = ([1,2,...,n) el conjunto finito “canónico” con n elemen- 
tos. Como corolario del Teorema 3.14, demuestra que los espacios vectoriales L£(n,m) y 
F(A,,R'") se pueden identificar naturalmente. 
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3.5 Matrices 


Las matrices son arreglos rectangulares de números, tablas podría decirse, donde los 
renglones y las columnas no tienen ningún significado extra, como podrían tener, por 
ejemplo, en la tabla de calificaciones parciales de alumnos en un curso. Así de simple, 
las matrices son tablas limpias, abstractas. En nuestro contexto actual, habrán de ser 
los “paquetes” que cargan toda la información de las funciones lineales y nos darán la 
herramienta para hacer cálculos respecto a ellas, además de simplificar la notación. 
En matemáticas, la notación es importante. Una notación clara y sencilla permite 
ver la esencia de las cosas, de las ideas y de los problemas. Por el contrario, con 
una notación complicada o confusa es fácil perderse en la labor de desentrañarla y 
nunca llegar a las ideas profundas; piénsese, por ejemplo, en diseñar un algoritmo 
para multiplicar con números romanos. Viene esto al caso, pues esta sección trata 
básicamente de cómo simplificar la notación para lograr manejar las transformaciones 
geométricas muy en concreto. Encontraremos la mecánica y la técnica para hacer 
cálculos con facilidad. Para empezar, cambiaremos nuestra notación de vectores. 


3.5.1 Vectores columna 


Como crítica a la notación que traemos, escribamos una función lineal f : R* — R* 
explícitamente. Digamos que f(e¡) = (1,2,3), f(e2) = (6,5,4) y f(e3) = (2,3,1); 
entonces sabemos que f se escribe 

x(1,2,3) + y(6,5,4) + z(2,3,1) 

= (x+6y+2z,2x+5y +2,3x +4y +2). 


f(x, y, z) 


Para hacer este cálculo, la vista tuvo que andar brincoteando en una línea, buscando 
y contando comas; es muy fácil equivocarse. Es más, ¿dónde está el error? Sin 
embargo, sabemos que el cálculo es sencillísimo, mecánico. Si en lugar de considerar 
los vectores como renglones los tomamos como columnas, el mismo cálculo se hace 
evidente a la vista 


x 1 6 2 x + 6y + 2z 
fl y |=x1| 2 |+yl| 5 | +21 3 | =| 2x+5y+3z (3.7) 
2 3 2 1 3Ix+4y+2 


y eliminamos las comas (y corregimos el error). Ahora cada renglón se refiere a una 
coordenada, y se ve todo de golpe; mucho mejor notación que haremos oficial. 


Notación 3.1 De ahora en adelante, los vectores en IR” se escribirán como colum- 


nas y no como renglones. Es decir, si antes escribíamos x = (Xx1,X2,...,Xn), ahora 
escribiremos 
X1 
X2 
X= 
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El inconveniente de que entonces se complica escribir un vector dentro del texto 
(aquí, por ejemplo), lo subsanamos al llamar a los vectores renglón, transpuestos 
de los vectores columna, y los denotaremos con Xx! = (x1,X2,...,Xn); o bien, x = 
(x1,X2,...,Xn)' conviniendo que los transpuestos de vectores renglón son los vectores. 
Aunque a veces se nos va a olvidar poner el exponente T de “transpuesto” y el lector 
nos lo perdonará; y con el tiempo nos lo agradecerá. 


Así, por ejemplo, tenemos que la base canónica de R? es e; = (0j" y €) = 


(0,1)', que quiere decir 
1 0 


Vale la pena insistir en que no hay ningún cambio esencial. Sólo cambiamos de 
convención, una pareja ordenada de números se puede pensar horizontal (de izquierda 
a derecha) o vertical (de arriba a abajo); estamos conviniendo en que lo haremos y 
escribiremos en sentido vertical. 


3.5.2 La matriz de una función lineal 


Una matriz de m x n es un arreglo rectangular (o tabla) de números reales con m 
renglones y n columnas. Si, usando dos subíndices, denotamos con aj; al número 
que está en el renglon i y la columna j, llamado entrada, tenemos que una matriz de 
mxmnes 


411 Ar :*:: Ain 

1 Az ::: An 
A = 

Aml Am2 *** mn 


Podríamos también definirla como un conjunto ordenado de n vectores en IR": sus 
columnas. Es decir, la matriz A anterior se puede escribir como 


ai 


a2i ; 
A = (u,u»,...,U,), donde u; = Í ER me 


Ami 


De tal manera que, de acuerdo con el Teorema 3.14, una matriz m x n tiene justo 
la información de una función lineal de R” en R'" (ojo: se invierte el orden por la 
convención de que las funciones se componen “hacia atras”). Explícitamente, a la 
matriz A se le asocia la función lineal f : R” —= ¡R'" que manda al vector canónico 
e; € R” en su columna i-ésima, es decir, tal que f(e;) = u; parai=1,2,...,n. O 
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bien, a la inversa, a cada función lineal f : R” —= R” se le asocia la matriz m x n que 
tiene como columnas a sus valores en la base canónica, es decir, se le asocia la matriz 


A=Me Tee. tlen)ls 


Por ejemplo, a la función lineal de R* en R* definida en (3.7) se le asocia la matriz 


16 2 
ZN A 
341 


que es ya una compactación considerable en la notación; a la transformación “com- 
padre ortogonal” de R? en R? se le asocia la matriz 


O —1 
(19) 
y a la función lineal que a cada vector en R* lo manda a su segunda coordenada (en 
R) se le asocia la matriz 1 x 3: ( O: =8 ) = (0,1,0). 
Ya logramos nuestro primer objetivo, empaquetar en una matriz toda la informa- 
ción de una función lineal. Ahora usémosla como herramienta. Primero, definiremos 
el producto de una matriz por un vector para que el resultado sea lo que su función 


lineal asociada hace al vector. Es decir, si A es una matriz m x n, podrá multiplicar 
sólo a vectores x € IR” y el resultado será un vector en IR”. Como ya vimos, A se 


puede escribir A = (u¡,u>,...,u,) donde u; € R”, para i= 1,2,...,n; y por su 
parte, sea x= (x1,X2,...,Xn)'. Definimos entonces el producto de A por x como 
Xx] 
X2 
Ax = (u;,u>,...,u,) ¿== Xx Uy + Xx2U2 +++: + Xp Ur, (3.8) 
*Xn 


de tal manera que el Teorema 3.14 junto con su corolario y lo que hemos visto de 
matrices se puede resumir en el siguiente teorema. 


Teorema 3.16 Las funciones lineales de R" en IR" están en correspondencia natural 
y biunívoca con las matrices de mx mn, de tal manera que a la función f le corresponde 
la matriz A que cumple 

f(x) = Ax 


para todo x € R”. 


Obsérvese que cuando m = 1 el producto que acabamos de definir corresponde a 
nuestro viejo conocido, el producto interior. Es decir, si x, y € R” entonces 


y ix=y-X. 


Dibujo 
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De tal manera que si escribimos A como una columna de renglones, en vez de un 


renglón de columnas, entonces hay vectores v¡,Vz,...,Vm E R” (los renglones) tales 
que 
v; vi -X 
v, V> -X 
Ax = Ñ x= 
Vi Vm Y x 


Esta definición del producto de una matriz por un vector es, aunque equivalente, más 
“desagradable” que la anterior, pues los vectores ví; € I¡R” no tienen ningún significado 
geométrico; son simplemente la colección ordenada de las i-ésimas coordenadas de los 
vectores u; € R'. Aunque somos injustos, sí tienen un significado, los renglones v;' 
son las matrices asociadas a las m funciones lineales ¡R” —> R que dan las coordenadas 
de la función original. 

Para fijar ideas, y no perdernos en las abstracciones, terminamos esta sección con 
la expresión explícita del caso que más nos interesa en este libro: la multiplicación de 
una matriz de 2 x 2 por un vector en R?, que tiene la fórmula general 


(00)(y) (tas) 


donde todos los protagonistas son simples números. 


EJERCICIO 3.64 Encuentra las matrices asociadas a las funciones lineales de algunos 
de los ejercicios anteriores. 


EJERCICIO 3.65 Un vector v € IR” se puede pensar como matriz n x 1. Como tal, ¿a 
qué función lineal representa según el Teorema 3.167? 


EJERCICIO 3.66 El conjunto de todas las funciones lineales de JR” en JR", que de- 
notamos con £(n,m) en la Sección 3.4.2, tienen la estructura de espacio vectorial y el 
Teorema 3.16 dice que está en biyección natural con las matrices m x n. Si definimos la 
suma de matrices y la multiplicación de escalares por matrices de modo que correspondan 
a las operaciones análogas en £(n, m), demuestra que A+B (que tiene sentido sólo cuando 
A y B son del mismo tipo m x n) es sumar entrada por entrada, y que tA es multiplicar 
todas las entradas por t. ¿Puedes dar una demostración fácil de que £(n, m) es un espacio 
vectorial? (Observa, del ejercicio anterior, que £(1,n) se identifica naturalmente con R”.) 


3.5.3 Multiplicación de matrices 


Vamos ahora a definir la multiplicación de matrices correspondiendo a la composición 
de funciones lineales. Tiene sentido componer dos funciones sólo cuando una “acaba” 
donde la otra “empieza”; más formalmente, cuando el codominio de una coincide con 
el dominio de la otra. De igual forma, sólo tendrá sentido multiplicar las matrices 
cuyas dimensiones se “acoplen”. Veámoslo. 
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Sean f : RT — RY y g: IR” — RY dos funciones lineales. Por el Ejercicio 3.49, 
gof: R” > RE también es lineal. Sean A la matriz m x n y B la matriz k x m que 
corresponden a f y a g respectivamente. Definimos el producto BA como la matriz 
kxmn que corresponde a la función lineal g of. Es decir, BA es la única matriz kx n 
que cumple 


(go f)(x) =(BA)x para todo xE€R”. 


Aunque esta definición ya es precisa según el Teorema 3.16, todavía no nos dice 
cómo multiplicar. Esto habrá que deducirlo. Recordemos que las columnas de una 
matriz son las imágenes de la base canónica bajo la función asociada. Así que si 
A = (u;,,u»,... 4, ) donde u; = f(e,) € R”, entonces (g o f)(e;) = gl(f(e;)) = 
g(u;) = Bu;. Y por lo tanto 


BA =B (u;,u,...,u,) = (Bu¡, Bu,,...,Bu,). 


Lo cual es muy natural: para obtener las columnas de la nueva matriz, se usa la 
multiplicación de B por los vectores columna de A, multiplicación que ya definimos. 
Para expresar cada una de las entradas de la matriz BA, habrá que expresar B como 
una columna de vectores renglon, y se obtiene 


w W:U WU :-: wW:u, 
w, W:Uu W:U +: wW-:Uu, 

BA = l (u,u,... , Un) = : My , (3.9) 
Wi W:U We: -+:*: W:Uu, 


En esta fórmula queda claro por qué los renglones de B (los transpuestos de los 
vectores W;) y las columnas de A (los vectores u;) tienen que estar en el mismo 
espacio (R"); y cuál es la mecánica! para obtener las entradas de una matriz k x n 
(BA) a partir de una k x m (B) y una mx n (A). Esta fórmula da, en el caso de 
matrices 2 x 2, lo siguiente 


a b a BA 7 aa +by ap +.b9 
e dl y 5) | ca+dy cB+dó )' 
EJERCICIO 3.67 Sean 


01) (79) 


Calcula AB, A(B+C), (C — BJA 


'La mecánica de la multiplicación de matrices corresponde a la ley del karatazo: un karateca en 
guardia pone su antebrazo derecho vertical y el izquierdo horizontal —¡(huuouui)!— y se apresta 
a multiplicar dos matrices: recoge con la mano derecha una columna de la matriz derecha y — 
¡(aaah¡, aah>,--- ,ahx)'!— le va pegando karatazos a los renglones de la izquierda para obtener 
la columna correspondiente en el producto; y si es zurdo puede recoger con su buena renglones de 
la izquierda y —¡(uuuf¡,uuf,,:-- ,uf, )!— golpear a las columnas derechas (codo arriba) para ir 
sacando, de una en una, las entradas del producto. 
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EJERCICIO 3.68 Exhibe matrices A y B de 2 x 2 tales que AB 4 BA. De tal manera 
que el producto de matrices no es conmutativo. 

EJERCICIO 3.69 Exhibe matrices A y B de 2 x 2 tales que AB = 0, pero A %0 
y B 4 0; donde O es la matriz cero (con todas sus entradas 0). (Piensa en términos de 
funciones.) 

EJERCICIO 3.70 Demuestra que si A,B,C son matrices 2 x 2, entonces A(BC) = 
(AB)C, es decir, que el producto de matrices es asociativo, y por lo tanto tiene sen- 
tido escribir ABC. (No necesariamente tienes que escribir todo el producto y tal vez tu 
demostración valga en general.) 

EJERCICIO 3.71 Demuestra que si A,B,C son matrices 2 x 2, entonces A(B + C) = 
AB+AC y (A+B)C=AC+BC. 

EJERCICIO 3.72 Demuestra que si A, B son matrices 2 x 2 entonces A(kB) = (kA)B = 
k(AB) para cualquier k € R. 

EJERCICIO 3.73 Usando que la composición de funciones es asociativa demuestra que 
si A,B,C son matrices n x n entonces A(BC) = (ABJC. 


3.5.4 Algunas familias distinguidas de matrices 
La matriz identidad 


Aunque propiamente dicho no sea una familia se merece su párrafo aparte y, además, 
ser el primero. La matriz identidad, o simplemente “la identidad”, es la matriz aso- 
ciada a la función identidad, que se denota por l, y es la matriz que tiene 1 en la 
diagonal y 0 fuera de ella, es decir 


10 - 0 

0 1. 0 
I := E 

¡E 1 


Cumple además que Al = A e IA = A para cualquier matriz A que se deje multiplicar 
por ella: es la identidad multiplicativa. Nótese que en realidad hay una identidad para 
cada dimensión, empezando por el 1; así que deberíamos escribir algo así como I,, 
pero el contexto en que se usa siempre trae la información de la dimensión. 


Homotecias 


Las homotecias, como funciones, son simples “cambios de escala”. Si tomamos un 
número k € R, k 4 0, la función f : R” —> ¡R” definida por f(x) = kx es claramente 
lineal y se llama una homotecia. Entonces tiene una matriz asociada que es kl, la 
matriz que tiene sólo k en la diagonal y 0 fuera de ella. Como función, lo que hace es 
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expander uniformemente desde el origen (si k > 1), o bien contraer (cuando k < 1); 
son un 200m, pues. 

Las homotecias tienen la propiedad de conmutar con cualquier otra matriz, pues 
A(kI) =k(Al) =kA = k(1A) = (kI)A (y aquí, pudo haber sido que las dos 1 sean 
diferentes, lo que depende de A). En términos de funciones, el cambio de escala se 
puede hacer antes o después de una función lineal y da lo mismo. Y además son las 
únicas matrices (pensando en matrices cuadradas) que tienen esta propiedad; pero 
esto lo dejamos como ejercicio. 


EJERCICIO 3.74 Demuestra que si una matriz A de 2 x 2 es tal que AB = BA para 
todas las matrices B de 2 x 2, entonces A = kl para alguna k € R. (Tienes que encontrar 
matrices apropiadas B que te vayan dando información; quizás conviene ver el siguiente 
párrafo y regresar.) 


Matrices de permutaciones 


Recordemos de la Sección 3.1 que una permutación de n elementos es una función 
biyectiva p : A, —> A,, donde podemos tomar A, =(1,2,...,n); y que todas estas 
permutaciones forman el grupo simétrico de orden n, S,,, con n! elementos. Ahora 
bien, a cada permutación p : An — A, se le puede asociar la función lineal f, : 
R" — R” definida por f,(e;) = ep(1); es decir, f, permuta a los elementos de la base 
canónica según p y se extiende linealmente a R”. A la matriz asociada a esta función 
lineal se le llama la matriz de la permutación p; denotémosla A,. Es fácil ver que la 
multiplicación de matrices de permutaciones es de nuevo una matriz de permutación 
y corresponde a la composición de las permutaciónes correspondientes. Es decir, si 
p, 0 ES,, entonces A/Ays = Apos. Se tiene entonces que el grupo simétrico se puede 
ver como un “grupo de matrices”. 


Otra manera equivalente de definirlas es que son las matrices cuadradas de ceros 
y unos tales que tienen exactamente un 1 en cada renglón y en cada columna. Por 
ejemplo, la matriz 


ooo 
ooo 
"000 
ooo — 


corresponde a la permutación (1 + 3,2>52,3>24,4H 1). 


EJERCICIO 3.75 Escribe todas las matrices de permutaciones de orden 2. 


EJERCICIO 3.76 Escribe todas las matrices de permutaciones de orden 3. Identifica 
sus inversas (es decir la matriz asociada a la permutación inversa), y describe en cada caso 
la transformación lineal de R? correspondiente. 


Dibujo 
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EJERCICIO 3.77 Sea Ap la matriz de la permutación p : An — An, y sea B cualquier 
otra matriz de n x n. Describe a las matrices BA¿ y A¿B en términos de la permutación p. 


*EJERCICIO 3.78 Sea C el cubo en R* centrado en el origen, de lado 2 y con lados 
paralelos a los ejes coordenados; es decir, sus vértices son los ocho puntos cuyas tres coor- 
denadas son 1 o —1. Describe el conjunto de matrices cuyas funciones lineales asociadas 
mandan al cubo en sí mismo. En particular, ¿cuántas son? (Quizás valga la pena empezar 
con el problema análogo en dimensión 2.) 


Rotaciones 


Regresamos, después de un provechoso paréntesis, a la motivación original que nos 
llevó a adentrarnos en las funciones lineales. 

Sabemos que una rotación es una transformación lineal que manda al vector 
canónico e; en un vector unitario u € S! y al otro vector canónico ez en su compadre 
ortogonal u+. Si escribimos a u en términos de su ángulo respecto del eje x, es decir, 
respecto a e,, entonces obtenemos que la matriz asociada a la rotación por un ángulo 


8 es 
Ro — cos8 —sin0 
9" sin09 cos0 " 


Primero veamos que la rotación de un ángulo —08 nos regresa a la identidad. Como 


cos(—9) =co0s8 y  sin(—8) = —sin0 (3.10) 
entonces 
RR — cosé sin cosé —sin0 
A —sin8 cos sin8  cos8 
cos? O + sin? O cos 8(— sin 8) + sin 8 cos O 
—sin 0 cos O + cos O sin O sin? O + cos? 0 


z (o JE 


Podemos obtener las fórmulas trigonométricas clásicas para el coseno y el seno de 
la suma de ángulos como consecuencia de la composición de funciones y la multipli- 
cación de matrices. Está claro que si rotamos un ángulo ($ y después un ángulo «, 
habremos rotado un ángulo «+ $. Así que 


RaRe = Ra+g- 
Pero por otro lado, al multiplicar las matrices tenemos 
cos —sin a cos f —sin fB 
RaRg E . . —= 
sinx cosa sinf cos (3 
cos cos $ — sin asin ff —cos asin f — sin arcos fa) 
sin cos KB ++cos «sin fH —sinasinf +cosacos fp )* 


3.5. MATRICES 141 


Y por lo tanto 


cosía+f) = cosacos f — sin asin (3.11) 


sin(a+f) = sinacos f3 + cos asin f, 


pues si dos matrices coinciden (Ra+g y RaRg) lo hacen entrada por entrada. Junto 
con las igualdades trigonométricas de inversos de ángulos, estas últimas dan 


cosí[a — fB) = cosacos f + sin asin f (3.12) 
sin(a—f) = sinacos f — cos asin f. 


EJERCICIO 3.79 Da una expresión numérica bonita de las matrices asociadas a las 
rotaciones de 711/6, 71/4,71/3,277/3, 70, —T1/2. 


EJERCICIO 3.80 Demuestra que 
cos2a = cos? xa—sin? a 


sin2a = 2sinacos«. 


Reflexiones 


Conviene parametrizar las reflexiones no por el ángulo de la imagen de ey, sino por 
su mitad, que es el ángulo de la recta-espejo de la reflexión. Pues si, como es natural, 
a una recta por el origen le asociamos su ángulo (entre 0 y 71) con el rayo positivo 
del eje x, entonces la reflexión, Es, en la recta con ángulo € manda a e; en el vector 
unitario de ángulo 20, y por lo tanto su matriz asociada es 


Ea cos28  sin20 
9" A sin28 —cos28 )” 


pues el segundo vector no es el compadre ortogonal sino su negativo. Es muy fácil 
ver que EgEjy = I, que corresponde a que una reflexión es su propia inversa. 
Podemos ahora ver cómo se comporta la composición de reflexiones: 


EsEg= 
e cos2x  sin2a cos2fB  sin2f 
o sin2a —cos2a sin2f4 —cos2f 
cos 2acos2(3 +sin2asin2f4  cos2asin2f — sin 2acos 2(3 
sinZacos2f4 —cos2asin2f sin2asin2f + cos Za cos2(f 


El cos2(a—f) —sin2(x— f) qe 
o sin2(a—f)  cos2(x— f) —= N(a—B) 


Animacion 
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donde hemos usado (3.12). Así que la composición de dos reflexiones es la rotación 
del doble del ángulo entre sus espejos. Tal y como lo habíamos visto al hablar de 
generadores de grupos diédricos. 


EJERCICIO 3.81 — Da una expresión numérica bonita de las matrices asociadas a las 
reflexiones en espejos a 0,71/6,711/4,11/3,1/2,21/3,37/4. 


EJERCICIO 3.82 ¿Quiénes son EyRg y RgEx? 
EJERCICIO 3.83 Demuestra con matrices que RgE¿R_¿ = Eg. 


EJERCICIO 3.84 Demuestra que la fórmula (3.3) obtenida en la Sección 3.3.1 para la 
reflexión (pg en la línea f, coincide con la que nos da una matriz Eg cuando la línea l pasa 
por el origen. 


Matrices ortogonales (y transpuestas) 


Decimos que una matriz es ortogonal si su función lineal asociada es ortogonal. Según 
nuestro estudio de las transformaciones ortogonales en IR?, las matrices ortogonales 
de 2 x 2 son las que acabamos de describir: las rotaciones y las reflexiones. Podemos 
considerar entonces al grupo de transformaciones O(2) como un grupo de matrices 
con la operación de multiplicación. 


Nótese que en las matrices de rotaciones y reflexiones, la matriz inversa, esto es, 
la matriz asociada a la transformación inversa, resultó ser muy parecida a la original; 
en las reflexiones es la misma y en las rotaciones se intercambian los elementos fuera 
de la diagonal (que difieren sólo en el signo). Esto no es coincidencia sino parte de 
algo mucho más general, que haremos explícito en esta sección y que será importante 
en capítulos posteriores. 

Llamemos a una matriz ortogonal si es cuadrada y su función lineal asociada es 
una transformación ortogonal (que preserva producto interior). Entonces, si A es 
ortogonal, todas sus columnas son vectores unitarios (pues son la imagen de vectores 
unitarios, los canónicos) y además por parejas son ortogonales (pues así es la base 
canónica y esto se detecta por el producto interior). Dicho más explícitamente, si 
A = (u;¡,u,...,u,) entonces u; = f (e;) donde f es su función asociada (f (x) = Ax), 
y si f € O (2) se cumple que 


o == 6= 05 3= a 

E A HO: E 
donde $, es conocida como “la delta de Kroenecker”. En este caso, al conjunto 
ordenado de vectores u;,uz,...,u, se le llama base ortonormal (pues son vectores 
unitarios o normalizados y mutuamente ortogonales). Pero nótese que estos n? pro- 
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ductos interiores (u; - 4¿) son las entradas de la matriz 


u; uy: uy uy: U uU -*** u-u, 


u, uU:uy uU:- Um: u-:u, 


u, u,- Uy UU) --: UU, - Un 

y que el que sean iguales a la delta de Kroenecker quiere decir que ésta es la matriz 
identidad. Así que si llamamos transpuesta de una matriz a la que se obtiene cam- 
biando columnas por renglones, hemos demostrado que la “inversa” de una matriz 
ortogonal es su transpuesta. 


En general, llamemos la transpuesta de una matriz A = (v,,v>,...,Vn) a la matriz 
vi 
a e 
yt 


que se obtiene al reflejar las entradas en la diagonal; si A es m x n entonces A' 
es n Xx mM y se generaliza nuestra noción previa de transpuestos de vectores. Hemos 
demostrado la mitad del siguiente teorema. Su otra mitad, para el caso que más 
nos interesa, n = 2, es consecuencia inmediata de la Proposición 3.12. Sin embargo 
damos una nueva demostración, muy general, para ejemplificar el poder de la notación 
matricial. 


Teorema 3.17 Una matriz A den xn es ortogonal (la matriz de una transformación 
ortogonal) si y sólo si 
A A=L 


Demostración. Hemos demostrado que si la función f (x) = Ax preserva producto 
interior entonces su matriz cumple que A'A = 1. Supongamos ahora que ATA =1y 
demostremos que su transformación asociada preserva producto interior. Para esto, 
expresaremos al producto interior como un caso más del producto de matrices. Para 
cualquier Xx, y € IR”, se tiene 


f (x) -f (y) =Ax-Ay =(Ax)' Ay=(x"A") Ay=x' (A"A)y=x'(Dy=x-4, 


donde hemos usado que (Ax)! =x AT (lo cual es un caso particular de la fórmula 
(AB)' =B"AT que se deja como ejercicio). Por lo tanto, f es ortogonal (y también 
A lo es). O 


Así que aunque las entradas de las matrices ortogonales sean complicadas, encon- 
trar sus inversas es muy fácil. Y se explica por qué las inversas de las ortogonales 
2 x 2 fueron tan parecidas a sí mismas. 
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EJERCICIO 3.85 Sea u, v, w una base ortonormal de R3, y sea f : R3 — RÍ definida 
por 

f(x,y,2) =XU+yv+zw. 
Demuestra directamente que f es ortogonal (preserva producto interior). (Compara con la 
Proposición 3.12.) 
EJERCICIO 3.86 Demuestra que (Ax)' =x'A' cuando A es una matriz mx n y x 
un vector (n x 1). 
EJERCICIO 3.87 Demuestra que (AB)' =B'A' cuando A es una matriz mx n y B 
una matriz (n x k). 


EJERCICIO 3.88 Demuestra que la “matriz de Pitágoras” 


1/4 3 
5134 


es ortogonal. 


3.6 El Grupo General Lineal (GL(2)) 


En esta sección estudiamos las matrices cuyas funciones lineales asociadas son trans- 
formaciones, es decir, biyectivas. La definición abstracta será entonces muy fácil, 
aunque después habrá que hacerla más concreta. 


Definición 3.6.1 Una matriz A de n x n es invertible si existe otra matriz den xn, 
llamada su inversa y denotada A”! tal que AA7! = ATA =1. Al conjunto de todas 
las matrices invertibles de n x n se le llama el grupo general lineal de orden n y se le 
denota GL(n). Así que A € GL(n) quiere decir que A es invertible y de n x n. 


Para demostrar que las transformaciones lineales f : R”" — ¡R” tienen matrices 
asociadas que son invertibles sólo habría que ver que su función inversa también es 
lineal (ver el ejercicio siguiente), y entonces la matriz asociada a ésta será la inversa. Y 
al revés, si una matriz tiene inversa entonces las funciones lineales asociadas también 
son inversas. Así que a GL(2) se le puede pensar como grupo de transformaciones, 
tal y como lo hicimos en las primeras secciones de este capítulo, o bien como grupo 
de matrices (donde, hay que enfatizar, la operación del grupo es la multiplicación de 
matrices). 

Ejemplos de matrices invertibles son las ortogonales que ya hemos visto. Así, 
tenemos que O(n) es un subgrupo de GL(n). 


EJERCICIO 3.89 Sea f: ¡R” => ¡R" una transformación lineal; es decir, una función 
lineal con inversa f —!. Demuestra que su inversa también es lineal. 
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3.6.1 El determinante 


Veamos ahora el problema de detectar de manera sencilla las matrices invertibles de 


2x2. Sea 
a b 
Aa 


una matriz cualquiera de 2 x 2. Consideremos el problema general de encontrar su 
inversa, y de paso ver cúando ésta existe. "Tomemos entonces una matriz X cuyas 
entradas son incógnitas, digamos x, y, Z, w, que cumplan 


a b A A SN 

E dl YA JOAO AA 
Esto nos da un sistema de cuatro ecuaciones con cuatro incógnitas, que en realidad 
se parte en los dos sistemas de dos ecuaciones con dos incógnitas siguientes 


ax+by=1 az+bw=0 
ecx+dy=0 y ecez+dw=1, 


que provienen de cada una de las columnas de la identidad, o bien de las columnas de 

incógnitas. Recordando la Sección 1.6, o bien volviéndola a resolver, se obtiene que si 

ad—bc 4 0, entonces los dos sistemas tienen soluciónes únicas que son precisamente 
d —b 


== tab. 7 alo ALS) 


=€ a 


ae. * .md=ve 


Para enunciar esto de manera elegante conviene definir el determinante de la matriz 


A como el número 
de 2) =0d=>e. 
cd 


Nótese que si A = (u,v), entonces det(A) = det (u,v) según lo definimos en la 
Sección 1.7, de tal manera que el determinante de una matriz es el determinante de 
sus columnas o el determinante de un sistema de ecuaciones asociado y sólo estamos 
ampliando naturalmente el espectro del término. 


a b 


Teorema 3.18 Sea A = ( e ) entonces A es invertible si y sólo si det(A) = 


ad —bc AX 0; y en este caso 
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Hemos demostrado que si det(A) 4 0 entonces A es invertible y su inversa tiene 
la expresión indicada por (3.13). Nos falta ver que si A tiene inversa entonces su 
determinante no es cero. Pero esto será consecuencia inmediata del siguiente lema 
que nos da el determinante de un producto. 


Lema 3.19 Sean A y B matrices 2 x 2, entonces det(AB) = det(A) det(B). 


Demostración. Sea A como arriba y consideremos B con letras griegas. Se tiene 
entonces que 


det(AB) 


ll 
a 
O 
cr 

PES: 
STO 
¡So! 
a 
=x__ 
ZSTO 
2 2 
N Dm 
xo 
UA 


= (ax +by) (cf + do) — (af + b9) (ca + dy) 
= adxcf + aadó + bycf + bydó 
—afea — apdy — bóca — bódy 
= ad(ad — By) + be (By — ad) 
= (ad— bc) (ad — By) = det(A) det(B). 


O 


Demostración. (del Teorema 3.18). Si A es una matriz invertible entonces existe 
A”! tal que AA”! = 1. Por el lema anterior se tiene entonces que det(A) det(A7!) = 
det(I) = 1, y por lo tanto det(A) no puede ser 0. O 


Veamos por último que el determinante de una matriz tiene un significado geomé- 
trico. Por el Teorema 1.30, corresponde al área dirigida del paralelogramo generado 
por sus vectores columna. 


Teorema 3.20 Sea A una matriz 2x2, entonces det(A) es el área del paralelogramo 
definido por sus vectores columna. Ol 
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Se dice que la matriz A, o que la función f(x) = Ax, ¿invierte orientación si 
det(A) < 0, o bien, que la preserva si det(A) > 0. Esto corresponde a que cualquier 
figura que no tenga simetrías de espejo (por ejemplo, un “manquito” de la mano 

izquierda) se puede orientar, y bajo transformaciones lineales que 
preservan orientación, la figura puede deformarse pero conserva su ori- 
entación (el manquito seguirá siendo manquito de la mano izquierda); 
pero bajo transformaciones que invierten orientación se verá como 
manquito de la otra mano. 
Pero además, el determinante de A representa lo que la función 
f “distorsiona” las áreas. Es decir, si una figura cualquiera F tiene 
área a, entonces f(F) tendrá área a ldet(A)|. Sin pretender dar una 
demostración formal de esto, en general se puede argumentar como 
sigue. Puesto que la imagen del cuadrado unitario, C, bajo la función 
f asociada a la matriz A = (u,v), es el paralelogramo generado por u y v, primero 
hay que ver que cuadraditos con lados paralelos a los ejes y de lado e (y área e?) van 
a dar a paralelogramos de área e? det(A); y luego observar que las áreas se pueden 
aproximar por cuadraditos disjuntos de este tipo. Con esta interpretación geométrica 
del determinante es natural que el determinante de un producto sea el producto de 
los determinantes, pues el factor de distorsión de áreas de una composición debía de 
ser el producto de factores de distorsión. 

Observemos por último que el determinante distingue nuestras dos clases de ma- 
trices ortogonales (en O (2)); es 1 para las rotaciones, y —1 para las reflexiones. Es 
decir, las rotaciones preservan orientación y las reflexiones la invierten. Además su 
multiplicación corresponde a cómo se multiplican 1 y —1. 


EJERCICIO 3.90 Demuestra que el determinante de las rotaciones es 1 y el de las 
reflexiones —1. 


EJERCICIO 3.91 Sea f : R? — R? la transformación lineal asociada a la matriz A € 
GL(2), y sea T cualquier triángulo en el plano. Demuestra que el área de f(T) es Idet(A)| 
por el área de T. 

EJERCICIO 3.92 SeaC =( ñ Pe ) |a,bER p; y sea C* =C— (0), es decir, todo 
C menos la matriz 0. Describe las funciones lineales asociadas. Demuestra que C* es un 


subgrupo de GL(2). Compara estas matrices con los números complejos. 


EJERCICIO 3.93 Encuentra (en cada caso) la matriz de la transformación lineal f : 
R? — R? que cumple: 

aj 12,1) =(1,0) y f(3,2) = (0, 1) 

b] 1(2,5)=(1,0) y f(1,2) = (0,1) 

c) f(2,1)=(2,5) y  f(3,2)= (1,2), 
donde hemos usado vectores renglón en vez de vectores columna por simplicidad. 


EJERCICIO 3.94 Demuestra que una transformación lineal de R? manda rectas en 
rectas. 
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EJERCICIO 3.95 Considera las rectas (l1 : x+y = 2); (L :2x—y = 1); (l3 :2x+uy = 6) 
y (l4 :x—4y =3). Encuentra la transformación lineal f : R2 — R? que cumple f((1) =l3 y 
f(£2) = la. 


3.6.2 Sistemas de ecuaciones lineales II 


Vale la pena resumir y reinterpretar explícitamente lo que hemos hecho sobre sistemas 
de dos ecuaciones lineales en dos incógnitas con nuestro nuevo lenguaje de matrices 
y funciones. Un sistema tal es una ecuación 


Ax=b, 


donde A es una matriz 2 x 2 dada y b es un vector constante en R?. Si f es la función 
líneal asociada a la matriz, resolver el sistema es encontrar un vector x que bajo f 
vaya a b. Si A tiene inversa, resolver el sistema es fácil pues se multiplican ambos 
lados por A”! para obtener 


x=A"!b, 


que es justo la primera fórmula que obtuvimos en la Sección 1.6.1. Y podemos resumir 
lo que hemos hecho en diferentes lados con el siguiente teorema que esencialmente ya 
hemos demostrado. 


Teorema 3.21 Sea A una matriz de 2x2 yf : R? — RR? su función lineal asociada. 
Entonces son equivalentes: 
¿) det (A) 0. 
11) La matriz A tiene inversa. 
íti) El sistema Ax =b tiene solución para toda b € R?. 
iv) El sistema Ax =b tiene solución única para alguna b € R?. 
v) La función f es inyectiva. 
vi) La función f es sobre. 
vii) La función f es biyectiva. Ol 


Además sabemos que si det (A) = 0 entonces la imagen de f es una recta por el 
origen (o el origen cuando A es la matriz 0) y entonces para los puntos b fuera de 
esa recta, el sistema Ax = b no tiene solución, mientras que para los puntos en ella 
hay una recta de soluciones; además estas rectas de soluciones son paralelas. 


3.7 Transformaciones afines 
El papel que tuvieron las transformaciones ortogonales respecto de las isometrías lo 


tendrán ahora las transformaciones lineales respecto de las que llamaremos afines. Es 
decir, si componemos una transformación lineal con una traslación no trivial, ya no 
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obtenemos una lineal (pues el origen se mueve) sino algo que llamaremos transfor- 
mación afín, generalizando para n > l a las transformaciones afines de R, que ya 
estudiamos. 


Definición 3.7.1 Una función f : |¡R" — R" es una transformación afín si se escribe 


f(x) = Ax +b 


para toda x € R”, donde A € GL(n) y b es un vector fijo en ¡R”. Dicho de otra 
manera, f es una transformación afín si existe una trasformación lineal f, : R” — R” 
(f.(x) = Ax) y una translación Tp tales que 


f=Tp O fo. 


El conjunto de todas las transformaciones afines de R” forman un grupo de transfor- 
maciones, llamado el grupo afín de R” y denotado con Af(n). 


Lo primero que hay que observar es que una transformación afín es efectivamente 
una transformación; y esto es claro pues es la composición de dos funciones biyectivas. 
Para ver que Af(n) es efectivamente un grupo, hay que ver que es cerrado bajo 
inversas y composición, pues la identidad (y de hecho cualquier transformación lineal) 
está en Af(n). Si f e Af(n) (dada por la fórmula de la definición) para obtener la 
fórmula explícita de su inversa, despejaremos X en la ecuación 


y =Ax+0Db, 


donde y desempeña el papel de f(x). Pasando b del otro lado y luego multiplicando 
por A”! (que existe pues A € GL(n)) se obtiene 


x=(A")y-—(A”)b. 


Sea entonces g : R” — RR” definida por la ecuación g (x) = (A7!)x — (A7!)b (nótese 
que g € Af(n) por definición) y se tiene que 


(gof)(x) = gl(Ax+b) 
(AT) (Ax+b)-—(A7)b 
= (ATA)x+ATb—-ATb=x, 


y análogamente se tiene que (f o g) (x) = x, así que g es la inversa de f. 

Si tomamos ahora g : IR” —> IR” como cualquier otra transformación afín, entonces 
se escribe g(x) = Bx + € para algunos B € GL(n) y c € R” de tal forma que (g o f) 
también es una transformación afín pues se escribe 


(go f)(x) = B(Ax+b) + ec = (BAJx + (Bb + c). 


Por lo tanto, Af(n) sí es un grupo de transformaciones. 


Dibujo 


Dibujo 


Dibujo 
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Las transformaciones afines preservan rectas, es decir, mandan rectas en rectas. 
Pues si una recta l está definida como 


l=[p+tv|teR) 


y f € Af(n), es como arriba, entonces 

fíp=+tv) = Al[(p+tv)+b 
(Ap +b) +t(Av) 
= f(p) +t(Av), 


de tal manera que 


f(4) C[f(p) +t(Av) |t e R). 


Y este último conjunto es la recta que pasa por f(p) con dirección Av (nótese que 
Av 40, pues vX 0 y A es invertible); así que más que una contención, la última es 
justo una igualdad (ambos conjuntos están parametrizados por R). 

Resulta que las transformaciones afines son precisamente las que preservan rectas. 
Pero la demostración de que si una transformación preserva rectas es afín es compli- 
cada y requiere argumentos de continuidad que no vienen al caso en este momento. 
Así que mejor nos enfocamos en otra cosa que sí preservan. 


3.7.1 Combinaciones afines (el Teorema de 3 en 3) 


Otra manera de ver que las transformaciones afines preservan rectas es usando coor- 
denadas baricéntricas. Sea l la recta que pasa por los puntos p y q. Entonces l se 
puede escribir como 


l=[sp+tq|s,teR, s+t=1). 
Veamos qué hace la transformación afín f al punto sp + tq cuando s+t= 1: 


físp+tq) = Al(sp+tq)+b 
s(Ap) +t(Aq) + (s +1) b 
s(Ap +b) +t(Aq + b) 
= sf(p)+tf(g), 
donde hemos usado que b = sb +tb pues s+t= 1. Así que la recta por p y q va, 
bajo f, a la recta por f(p) y f(q) y preserva las coordenadas baricéntricas. Y esto se 


puede generalizar. 
: Ld A k 3 el A A . . 
Una combinación lineal pa Av; se llama combinación afín si los coeficientes 


cumplen que os A; = 1. Le hemos llamado “combinación baricéntrica” cuando in- 
tervienen dos puntos distintos o tres no colineales, pero en el caso general no nos 
interesa qué propiedades tengan los puntos involucrados Vy,V;,...,Vx. Su importan- 
cia, entre otras cosas, es que las transformaciones afines las tratan como las lineales 
tratan a las combinaciones lineales: 
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Teorema 3.22 Una transformación f : R" —= R" es afín si y sólo si preserva com- 
binaciones afines; es decir, si y sólo si 


k 


k k 
O Mivi) = e Mfílv;) cuando DE Ae=l, 
i=0 i=0 


i=0 


Demostración. Sif: R” — R” es afín, entonces se escribe f(x) = Ax+b para alguna 
matriz A den x n y un vector b € ¡R”. Veamos que preserva combinaciones afines. 
Sean A; €R,i=0,1,...,k, tales que NOD» = l; y sean ví; €R”, i=0,1,...,k, 
vectores cualesquiera. Entonces 


k k k 
¡E Avi) = AD Aivi) +b = Y A(Av) +b 
i=0 , i=0 , e E 
= Y A(Av:) + S db = S (Av + b) = S df(v;). 
i=0 i=0 i=0 i1=0 


Donde se usó la linearidad en la segunda igualdad, y luego fue crucial que 0 Ay=1 
para poder “distribuir la b” en la sumatoria. 

Por el otro lado, si nos dan f que preserva combinaciones afines, debemos encontrar 
la matriz A (o su función lineal asociada) y el vector b que la definan. Encontrar 
el vector b es fácil pues es dónde cualquier transformación afín manda el origen; 
definamos entonces 


b:=f(0). 


Y, como sucedió con las isometrías, debemos definir la función g : IR” —> RR” con 


y demostrar que es lineal para concluir la demostración; pues entonces f (x) = g (x) + 
b. Veamos entonces que g preserva combinaciones lineales. 

Sean v1,...,Vx vectores en R” y 2,...,A, coeficientes (en R) arbitrarios. Debe- 
mos demostrar que g (ES Mv) = a Mg (v;), pero nuestra hipótesis sólo nos 
dice cómo se comporta f respecto a combinaciones afines. Podemos convertir esta 
combinación lineal en una afín usando el vector Ó como comodín. Sean 


k 


vi=0 y di=1=) XA 


i=1 


de tal manera que a A; = 1 (ojo, empezamos la sumatoria en 0) y E Mv; = 


Dibujo 


Dibujo 
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k , TO 
Y ¡1 MV; ; y ahora sí podemos usar nuestra hipótesis para obtener 


g (E 1) A pa 1) —=b f (2 1) = (2 ») b 


k k k 


= S df(v)-) Ab = S 2 (f(vi) —b) 


i=0 i=0 i=0 


k k 
= S dig (v) —- Mg (vo) + Y) Mmglv) > 2 Mglv), 
1 


i=0 i=1 


pues g (vo) = g(0) = 0. Lo cual concluye la demostración del teorema. O 


Vale la pena notar que el concepto de transformación afín se puede generalizar al 
de función afín cuando la matriz A no es necesariamente invertible; una función afín 
será entonces una función lineal seguida de una traslación; ni siquiera necesitamos 
pedir que el dominio y el codominio coincidan. Si se revisa con cuidado el teorema 
anterior, se notará que vale en esta generalidad. Pero no lo hicimos así pues nuestro 
interes principal está en las transformaciones. 

En el caso que más nos interesa, n = 2, este teorema y su demostración tienen 
como corolario que una transformación afín de R? queda determinada por sus val- 
ores en el triángulo canónico con vértices ey := 0,e,,€2, y que estos pueden ir a 
cualquier otro triángulo. Explícitamente, dado un triángulo T con vértices Ay, Ay, Az, 
la transformación afín que manda al triángulo canónico en T es 


f(x) = (a; — Mp, A7 — Ay)x + Mo, 


que cumple claramente que f (e;) = a;. Hay que observar que esta función está bien 
definida independientemente de quiénes sean Ay, A] y A, pues tanto la matriz 2 x 2 
como el vector por el que se traslada lo están. Pero que es una transformación sólo 
cuando Ay, A] y Az no son colineales (que es lo que entendemos como triángulo), pues 
entonces la matriz es invertible. 

Y como corolario de este hecho obtenemos el siguiente teorema. 


Teorema 3.23 (3 en 3) Dados dos triángulos con vértices Go, A], A2 y bo, b1,b, 
respectivamente, existe una única transformación afín f : R? —= R? que cumple 
f(a;) =b; parai=0,1,2. 


Demostración. Basta componer la inversa de la transformación que manda al trián- 
gulo canónico en el Ay, A, A) con la que lo manda al by,b,,b>. La unicidad se sigue 
de la unicidad de las dos transformaciones usadas. O 
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Un ejemplo 


Para fijar ideas veamos un ejemplo numérico. Sean 
0 3 O 
2 : a] = 3] , da, = 1 ) 
—5 4 —4 
O 


Queremos encontrar la transformación afín f : R? — R? que cumple f(a;) = b; para 
b= 0, 12 


Ao 


Dibujos 


Un método infalible (si no cometemos un error en el camino) es seguir la demostración 


del último teorema (el 6.4). Es decir, la transformación que manda al canónico en el 


triángulo de las a's es 
3 =] Xx 0 
(5 3)05)+0) 


luego habrá que encontrar su inversa y componerla con la que manda al canónico en el 

triángulo de las b's. Pero dejaremos este método para que el lector lo siga paso a paso 

y compruebe el resultado con una solución diferente que es la que aquí seguiremos. 
Ataquemos el problema directamente. Estamos buscando una matriz 


a= (5 0) y un vector e=(7) 


para definir la función f(x) = Ax + b que cumpla f(a;) = b¡ para i = 0,1,2. 
Como las a's y las b's tienen valores numéricos explícitos, estas condiciones nos 
darán ecuaciones explícitas con las seis incógnitas ax, (3, y, 6, A, 4 que podemos resolver 
directamente. La condición f(a7) = bo nos da 


a 0 sl AN A 
vóÓ 2 po xXx 6] 
que se traduce en una ecuación para cada coordenada, a saber: 


0xa+28 +1 = -5 
0y+28+u = 6. 


Análogamente, las condiciones en las otras dos parejas de puntos nos dan las siguientes 
ecuaciones: 


Ja—-B+A = 4 
ay dei = 03 
a HPA = —4 
=p 0. => 1 
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Resulta que en vez de seis ecuaciones con seis incógnitas, tenemos dos sistemas 
de tres ecuaciones con tres incógnitas, y además los dos sistemas tienen los mismos 
coeficientes y sólo se diferencian por las constantes. De hecho los podemos reescribir 
como 


o —5 Y 6 
Al PB |= 4 ESA dl ES le 
A —4 0) 1 

0 2 1 
donde A= 3 —1 1 
=1 1 1 


Observemos que al resolver los dos sistemas de ecuaciones con el método de eliminar 
variables sumando múltiplos de una ecuación a otra, estaremos realizando las mismas 
operaciones, y éstas dependen nada más de los coeficientes, no del nombre de las 
incógnitas. Así que la manera de resolver los dos sistemas al mismo tiempo será 
añadiéndo dos columnas a la matriz A que correspondan a las constantes de los dos 
sistemas, y luego sumando múltiplos de renglones a otros para llevar la parte 3 x 3 
de la matriz a una de permutaciones que nos diga el valor explícito de todas las 
incógnitas. Hagámoslo. La matriz con que empezamos es 


Dad RBA 
3 -_11:4:3 
1 111-4641] 


Sumándole 3 por el tercer renglón al segundo (para hacer 0 su primer entrada), 
operación que podemos denotar con 3r3+r, y que equivale a sumar un múltiplo de 
una ecuación a otra, obtenemos 

0 21-556 006 3 3 0 


> 


3r3+rz 0. 24-856 12 0.2 4 3 6 
=1 11-41 1-1-1 4 —] 


0.00 1 -_1 0 001-150 
(1/23r2-(1/3r | 0 1 2 -—4 3 12 +3 012-453 
1-1-1 4 -—1 ¡O E A € AS 
0011-10 
2r; Pr); r] Frz 0110-23 
100 1 2 
Ahora, recordando nuestras incógnitas, el primer sistema nos dice que A = —1, 


p=-—2 y a= 1 y el segundo sistema que 1H =0,5=3 y y =2, lo cual lo resuelve 
por completo. En resumen, la función que buscábamos es 


1t0= (> a) 


3.8. ISOMETRÍAS II 155 


y es fácil comprobarlo; ya sea revisando los valores que se pedían o con el otro método. 


EJERCICIO 3.96 Para cada caso, encuentra la transformación afín que manda a; en 


b; 
a) ao =(1,20 0 =(1,-1)',a2, =(0,-1)' y Do db = (4,4)*,b2 =(3,3)" 
b) de = (12) , A] =(0111.0:=(3=1* y bo =(5,3)',b: =(2,0)1/b2 =16, 1) 
c) a =(1,2)',a: 10:10) 4 =181)% y bo =(10,5)/1,by = (3,3)",b, = (-4,4)* 


(¿Verdad que conviene relajar la notación sobre vectores?) 


3.8  Isometrías II 


Ya con la herramienta técnica que nos dan las matrices y en el contexto general que 
nos dan las transformaciones afines, regresamos brevemente a estudiar isometrías del 
plano y ver algunas cosas que se nos quedaron pendientes. Ahora sabemos que una 
isometría de IR? es una transformación que se escribe 


f(x) =Ax+0b, (3.14) 


donde la matriz A es ortogonal (A' = A7!) y es llamada la parte lineal de la isometría. 
Hay de dos tipos. Las que preservan orientación (con det (A) = 1) y las que invierten 
orientación (det (A) = —1). Para las primeras, la matriz A es una rotación en el 
origen y para las segundas, una reflexión en una recta por el origen. Puesto que al 
componer isometrías (o, en general, transformaciones afines) la parte lineal se obtiene 
componiendo las partes lineales, entonces las isometrías (o las afines) que preservan 
orientación forman un grupo, denotado con Iso* (2) (respectivamente, Af* (2)). Ojo, 
las que invierten orientación no forman un grupo, ni siquiera contienen a la identidad 
y la composición de dos de ellas preserva orientación. 

Lo primero que queremos ver es que las isometrías que preservan orientación son 
rotaciones en algún punto o traslaciones. 


3.8.1 Rotaciones y traslaciones 


Recordemos que definimos la rotación Pg ¿ de un ángulo € con centro e, conjugando 
con la traslación de € al origen, es decir, como T¿ O Pg 0 T_¿, donde Ty €s la traslación 
por Y y Pg es rotar un ángulo 8 en el origen. Así que, usando matrices, la fórmula 
para Pg. es 


Pac [x) = Ral[x=cj+e 
Rex + (c— Roc). (3.15) 
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Está claro entonces que Pa. € Iso” (2), pues se escribe como en (3.14) con una b 
complicada, pero constante al fin. Y al revés, aunque cierto, no está tan claro. Para 
ver que f € Iso” (2) dada como en (3.14) es la rotación en algún centro, hay que 
encontrar un punto fijo, es decir, un punto € para el cual f(c) = € (pues a su centro 
no lo mueve la rotación); que nos da la ecuación en e 


ec = Ac+b 
e-Ac = b. 


Esto coincide con la expresión (3.15), donde se usa el centro de rotación y nos da la 
traslación b en términos de él. Entonces, el problema de encontrar un punto fijo para 
la transformación (3.14) equivale a encontrar una solución a la ecuación 


x—Ax=b 


que en realidad es un sistema de ecuaciones. Y como tal, se puede reescribir 


Ix— Ax b 
(I—A)x = b, (3.16) 


donde nos ha sido muy útil la suma de matrices. Sabemos que este sistema tiene 
solución única si y sólo si su determinante es distinto de cero. Para el caso que nos 
ocupa, cuando A es una matriz de rotación, por un ángulo € digamos, se tiene 


O des sen O ) 


—sen9 1-—cos8 
= (1—cos0)* + sen? 8 
1 —2c08 0 + cos? O + sen? 0 =2 (1 —cos8). 


Podemos concluir que si 9 4 0 entonces det (I— Ra) 4 0 y tenemos una solución única 
del sistema (3.16) con A = Ro, que es el centro de rotación. Así que si f € Iso* (2), 
entonces es una rotación (alrededor de un punto) o bien una traslación (cuando el 
ángulo 6 es cero en la discusión anterior). Además, hemos demostrado que una 
rotación (por un ángulo no cero, se sobreentiende) no tiene puntos fijos además de su 
centro. 

Puesto que una rotación o una traslación se puede obtener moviendo continua- 
mente (poco a poco) el plano, a veces se le llama a Iso* (2) el grupo de movimientos 
rígidos del plano. 

Como corolario se obtiene que la composición de dos rotaciones es una nueva 
rotación. El nuevo centro de rotación se puede obtener analíticamente resolviendo el 
correspondiente sistema de ecuaciones, pero lo veremos geométricamente. 


3.8. ISOMETRÍAS II 157 


Seal Poa Y Pp las rotaciones de ángulos a y fB y centros 
a y b respectivamente. La composición de estas dos rotaciones 
será una rotación de un ángulo a+ f (pues las partes lineales se 
componen) pero su centro depende del orden en que se compo- 
nen. Para obtener el centro de la rotación Pg y O Pa a, se traza el 
segmento de A a b, la línea por a con ángulo —a/2 respecto de 
este y la línea por b con ángulo (3/2; la intersección € de estas 
dos líneas es el centro de rotación. Para verlo, persígase este punto según las rota- 
ciones. Nótese que su reflejado respecto de la línea por A y b es el centro de rotación 
de la composición en el otro orden, Py a 9 Pg p- 

Para que nuestra construcción de C tuviera sen- 
tido se necesita que las dos rectas cuya intersección 
lo definen sean no paralelas y éste es justo el caso 
cuando x+ (3 % 0. Pero nos podemos aproximar al 
valor f = —a poco a poco, y en este proceso el punto 
de intersección € se “va al infinito”, así que las trasla- 
ciones son, en cierta manera, “rotaciones con centro al 
infinito”. 


EJERCICIO 3.97 Las homotecias son transformaciones de la forma f(x) = kx + b, 
donde a k 40 se le llama el factor de expansión . Demuestra que las homotecias con factor 
de expansión no trivial (distinto de 1) tienen un centro de expansión, es decir, un punto fijo 


3.8.2 Reflexiones y “pasos” 
Consideremos ahora las isometrías que invierten orientación. Se escriben como 


f(x) = Egx+b, 


donde Eg es una matriz de reflexión. Veamos primero si tiene puntos fijos, para lo 
cual hay que resolver el correspondiente sistema (3.16). En este caso el determinante 
es 


det (1 q Es) 


! 


det l—cos20 —sen20 
—sen209 1++c0s20 


= (1 —cos2) (1 + cos 20) — sen? 20 
= 1-—cos? 20 —sen?28=1-—1=0. 


Y por lo tanto no tiene solución única: o no tiene solución o bien tiene muchas; y 
veremos que ambos casos son posibles. 
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Para b = 0 tenemos que f es una reflexión y entonces las soluciones debieran ser 
los puntos de la recta espejo (a un ángulo 8 con el eje x positivo), que llamaremos l. 
Veamos: sea u el vector unitario que genera a l, es decir, u = (cos 6, sen 0). Entonces 


A e ” a cos29  sen20 cos O 
dd sen29 —cos20 sen O 


sen 20 cos 9 — cos 20 sen O 


cos 28 cos O + sen 28 sen O 
o — XA sen(20-—0) 


donde hemos usado las fórmulas trigonométricas para la diferencia 

de ángulos (3.12). Y por lo tanto Es (tu) =1t (Egu) = tu; que nos 
dice que todos los puntos de la recta l satisfacen la ecuación homogénea (1 — Es) x =0. 
Ahora bien, si para cierta b, el sistema (1 — Eg) x = b tiene una solución particular, e 
digamos, entonces toda la recta (+, paralela a l que pasa por Cc, consta de soluciones 
para el sistema; es una reflexión con espejo l + €. Pero nos falta determinar para 
cuáles b hay solución. 


Para esto, conviene pensar geométricamente. Para cualquier 
x E IR?, (I—Es)x = x — Egx es el vector que va de Egx a X, y 
como Eg es una reflexión debe ser perpendicular al espejo; es más, 
debe ser el doble del vector que va de l a x y es perpendicular a l 
(recuérdese que así definimos reflexiones por primera vez). De tal 


"EX manera que (1 — Eg) es, como función, 
po la proyección ortogonal a (+ :u-x=0 

seguida de la homotecia “multiplicar 
por 2”. La imagen de la función (I— Eg) es entonces (+, 
y por lo tanto, sólo cuando b € (* la isometría f (x) = 
Esx+b tiene puntos fijos. Más concretamente, si u-b = 
0, entonces reflejar en l y luego trasladar por b, regresa 
de la recta (+ (1/2) b a su lugar (y punto a punto). 


En el caso general, podemos expresar a cualquier b € R? como una suma de sus 
componentes respecto a la base ortonormal u, u*, es decir como 


b=b;¡+0b, 


con b; € l y b, € (* (de hecho, por el teorema de bases ortonormales: 
b¡ := (b-u)u y b, := (b-u*)u*). Y entonces la transformación 
f (x) = Esx + b se puede escribir como 


f (x) = (Esx + b>) + bi, 
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que es una reflexión en la recta £+ (1/2) b2 (por el caso anterior) y que en la fórmula 
es (Egx + b>), seguida de una traslación (...+0b1) en la dirección del espejo. Nótese 
que si b; 4 0, entonces f no tiene puntos fijos, los puntos de un lado del espejo van al 
otro lado y los que están en el espejo se trasladan en él, aunque el espejo £+ (1/2) b> 
como línea sí se queda en su lugar (todos sus puntos se mueven dentro de ella) y éste 
es entonces el caso en que nuestro sistema de ecuaciones que detecta puntos fijos no 
tiene solución. 

A una isometría tal, una reflexión seguida de una traslación no trivial (b 4 0) 
en la dirección de la línea espejo, la llamaremos un paso 
pues genera la simetría que tiene un caminito de huellas 
(infinito) y corresponde al acto de dar un paso: cambiar A 


de pie (reflejar) y adelantarlo un poco (trasladar). Si la “A 8 


aplicamos dos veces, nos da una traslación (por 2b), y si 
la seguimos aplicando (a ella y a su inversa) nos da un 
subgrupo de isometrías que son las simetrías de un camino 
infinito. Pero en fin, hemos demostrado: 


Teorema 3.24 Una isometría que invierte orientación es un paso o una reflexión 
(paso con traslación trivial). O 


EJERCICIO 3.98 Con la notación de los párrafos anteriores, demuestra con coorde- 
nadas que (I—Eg)u* = 2u?. (Tienes que usar las identidades trigonométricas para el 
doble del ángulo.) 

EJERCICIO 3.99 Demuestra que si f es una isometría que invierte orientación, entonces 
f? =fof es una traslación. 

EJERCICIO 3.100 Sea f(x) =Egx+b. Encuentra la expresión para f-!| y arguméntala 
geométricamente. 

EJERCICIO 3.101 Demuestra analíticamente que la composición de dos reflexiones en 
lineas paralelas es una traslación en la dirección ortogonal a sus espejos. 


3.8.3 Hiomotecias y semejanzas 


El clásico zoom que aumenta (o disminuye) de tamaño una figura es lo que llamaremos 
una homotecia. Siempre tiene un centro de expansión, que cuando es el origen resulta 
ser una transformación lineal con matriz asociada 


k 0 
(5): 


donde k > 0; para k > 1 magnifica (es un zoom estrictamente hablando) y para k < 1 
disminuye. Si la componemos con una traslación, por b € R? digamos, se obtiene 
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una homotecia de factor k. Su centro de expansión C es el punto que se queda fijo y 
que se obtiene entonces resolviendo la ecuación 


kx+b =x. 


Una semejanza es una transformación afín que preserva ángulos. Claramente las 
homotecias y las isometrías son semejanzas. Veremos que estas últimas se obtienen 
simplemente al dejar interactuar a las dos primeras. 


Teorema 3.25 Sif: R? — RR? es una semejanza, entonces existen k > 0, A € O(2) 
y b ER? tales que 


f(x) =kAx-+b. 


Demostración. Consideremos la transformación lineal g (x) = f(x) — b, donde 
b := f (0), y notemos que preserva ángulos pues las traslaciones lo hacen. Sea B = 
(u, v) la matriz asociada a g. Como los vectores canónicos son ortogonales entonces 
u y v (sus imágenes bajo g) también lo son. Además tienen la misma norma pues si 
no fuera así, los ángulos chiquitos del triángulo 0, u,v no medirían 711/4 que son los 
del triángulo canónico. Sean k = |ul = [v| y 

1 


A==B; 
k 


Se tiene que A € O(2), pues sus columnas son ortonormales, y además 


f(x) =9(x) +b=Bx+b =kAx-+.b. 


EJERCICIO 3.102 Encuentra la expresión de la homotecia de factor k y centro C. 


EJERCICIO 3.103 Demuestra que una transformación f : R? — R? es una semejanza 
si y sólo si existe k > 0 tal que d (f (x),f (y)) =kd(x,y) para todo x, y €R?. 


3.9 *Simetría plana 


En la Sección 3.3.2 se definió el grupo de simetrías de una figura plana; en esta última 
sección estudiamos diferentes instancias de cuales pueden ser estos grupos y cómo son 
sus figuras asociadas. 


3.9.1 El Teorema de Leonardo 


Versión topológica 
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Por una figura acotada F entendemos un subconjunto del plano que a su vez está, 
contenido en el interior de algún círculo; y por medio de una homotecia, podemos 
suponer que está dibujada en una hoja de papel. El problema general que nos guía 
es qué podemos decir sobre su grupo de simetrías 


O) 


E, 


Sim (F) = ([f € Iso (2) | f (F) = FJ. 


O bien, ¿qué grupos son de este tipo? Además de los grupos 
cíclicos y diédricos que vimos en la Sección 3.3.2 tenemos otros. 
Por ejemplo, si F es un círculo centrado en el origen, entonces 
Sim (F) = O (2). Nótese que también un conjunto de anillos 
concéntricos —un tiro al blanco— tiene este mismo grupo de 
simetrías. La figura F se genera por un pedacito Fy —un simple 
punto para el círculo y para el tiro al blanco un intervalo por 
cada anillo- juntando todas las copias f(Fp) al correr f € O (2); 
es decir, dejando que el grupo “barra” o “actúe” en una “figura 
fundamental” Fo. Y como en este caso el grupo es “continuo” 


(los ángulos de las rotaciones son un continuo) la figura que se genera también es 
“continua”. Podemos pensar que la figura F se obtiene “poniendo tinta” (de diferentes 
colores para el tiro al blanco) en los puntos de Fo y luego dejando que el grupo mueva 
a Fo y vaya dejando huella. Todas las figuras que tienen simetría se deben obtener 
así, una porción de ella y el grupo la definen: “simetría, se dice coloquialmente, es 
una relación armoniosa entre las partes y el todo”. 

Otro ejemplo es tomar el grupo generado por una rotación irracional. . Sea O un 
ángulo para el cual n8 (con n € Z) nunca es múltiplo de 271, es decir para el que no 
existen p, q € Z tales que 9 = (p/q) 271 (por ejemplo, 9 = V2rr, o 8 = 1 pues 71 como 
número ya es irracional)?. Entonces el conjunto (Ra) := (Rne | n € Z) es un grupo de 
rotaciones; para n = Ó tenemos la identidad y la composición de dos claramente está 
en él. En este caso, si tomamos un punto X distinto del origen (en nuestra notación 
anterior, Fo =(x)) las copias Rno (x) van poblando poco a poco (al crecer n en ambos 
sentidos) el círculo C con centro en O y que contiene a Xx, pues nunca caen sobre 
un punto ya “pintado”, pero nunca llegan a llenar todo el círculo; lo “pueblan”, lo 
“atascan”, son “densos en él” pero no lo llenan. Si definimos F = (Rne (x) | n € Z) 
entonces (Rne) € Sim(F) (no pusimos la igualdad pues aparecen reflexiones como 
simetrías). Sin embargo, esta “figura” no se le aparecería nunca a un artista (o vil 
ser humano) pintando en un papel con lápiz o plumón de cierto grosor. Para eliminar 
de nuestras consideraciones este tipo de figuras raras o abstractas, que sólo se le 
aparecen a un matemático quisquilloso, tendríamos que usar conceptos de “topología 
de conjuntos” que expresen nuestras nociones intuitivas de “continuidad”. 

La versión topológica del Teorema de Leonardo consiste en poner restricciones 
topológicas a las figuras (con “cerradas y acotadas” basta) para concluir que su grupo 


2Un número es irracional si no se puede expresar como una fracción p/q con p y q enteros. Por 
ejemplo VZ o Tr; aunque sea difícil demostrarlo. 
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de simetrías es O (2) o bien finito. Intuitivamente, lo de “cerrado” implica que si sus 
puntos se acumulan cerca de otro, ese también está, de tal manera que los “huecos” 
de nuestro último ejemplo se llenarían y las simetrías crecerían a todas las rotaciones 
y las reflexiones (O (2)). Pero dejemos ya de lado esta motivación para el estudio de 
la topología de conjuntos (cómo controlar particularidades sobre la “continuidad” de 
subconjuntos de IR?) y entremos de lleno en lo que sí estamos en posición de hacer: 
poner restricciones sobre el grupo en vez de sobre la figura; usar técnicas de geometría 
discreta. Demostraremos entonces la versión “grupera” del Teorema de Leonardo. 


Versión grupera 


Teorema 3.26 (Leonardo) Si G es un grupo finito de isometrías del plano entonces 
G es diédrico o cíclico. 


La demostración consta de cuatro pasos muy bien diferenciados y con ideas de 
distinta índole en cada uno. 

Paso 1 (El centro de simetría). Como G es un grupo finito, sea n > 1 su 
cardinalidad. Entonces podemos enumerar sus elementos como 


G=106: 9130.01 hs 


donde no importa el orden, salvo que podemos distinguir a gy como la identidad, que 
sabemos que está en G; y digamos de una vez que a Yo = idp2 también lo llamamos 
9. para facilitar la notación. 

Vamos a demostrar que existe un punto € € R? invariante bajo G, es decir, tal 


que gí¡ (e) = e para toda i= 1,...,n, que es naturalmente el centro de simetría del 
grupo. Encontrarlo es fácil. Tomamos cualquier punto x de R?, y e es el baricentro 
de su órbita Gx :=1(g1 (x),..., gn (x)). Es decir, sea 


(Estamos generalizando la noción de baricentro de un triángulo, 3 puntos, a conjuntos 
arbitrarios, pero finitos, de puntos.) Para ver que e es invariante bajo G, usamos el 
hecho de que las isometrías son funciones afines y que éstas preservan combinaciones 
afines (Teorema 3.22), pues definimos e como una combinación tal ()-;-, (1/n) = 1). 
Se tiene entonces que para cualquier g € G (podemos eliminar su subíndice para 
aliviar notación): 


9)= Y (7)9t:001= 9 (7) (009000. (3.17 


i=1 i=1 


Afirmamos que esta última sumatoria es justo la original (que definió a €) salvo que 
el orden de los sumandos está permutado. Esto se sigue de que “componer con g” es 
una biyección del grupo en sí mismo (una permutación de los elementos del grupo). 
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Más formalmente, definamos la función multiplicación por g como 
4 :6>6 
Hy (gi) =9 0 Qi. 


Que está bien definida (que siempre caemos en elementos de G) se sigue de que G es 
cerrado bajo composición; y para ver que es biyección basta exhibir su inversa: Hy-1, 
multiplicar por g”? (de nuevo bien definida pues g”? € G). Claramente se tiene que 
H¿-1 0 Uy = id pues 


(1,-1 0 4) (91) = 1,1 (1, (9:)) = 1,1 (go gi) =97 0909: =91 


y análogamente, uy o H¿-1 =id6. 

Así que la combinación afín que da g (c) (3.17) es un simple reordenamiento de la 
que da € y por lo tanto g (ec) = € para toda g € G. Hemos demostrado que G tiene 
centro de simetría y, en particular, que no contiene ni traslaciones ni pasos pues estas 
transformaciones no tienen puntos fijos. 

Paso 2 (Vámonos al origen). Ahora veremos que podemos suponer que el 
centro de simetría de G es el origen, y simplificar así nuestras consideraciones sub- 
secuentes, usando nuestro viejo truco de conjugar con la translación de € al origen. 
Más formalmente, sea 


Go =T-¿0GoT¿:S3[T_¿OgO0TE|gE G), 


(el conjunto de los conjugados de todos los elementos de G). Nótese que si g € G 
entonces (T_¿0g9g0T¿)(0) =T_¿(g(T.(0))) =T-¿[g[(ce)) = 7 .(c) =0 así que O es 
el centro de simetría de Goy. Es muy fácil ver que Go también es un grupo y que es 
isomorfo al grupo original G (si G fuera el grupo de simetrías de una figura F, Go es el 
grupo de simetrías de T_¿(F) —F trasladada al origen— y ambas figuras claramente 
tienen la “misma” simetría), pues la conjugación respeta composición 


Tao MENS TE =T2 0100 (Teto (T O Mo To (1000 Te) 


1 —1 


e inversos ((T_¿0g 0 Te) = Tr. og dor! =wT_ ¿og? oT¿). De hecho, la función 
inversa de la conjugación es la conjugación por la inversa, G = T¿OGpQ0 Tc. Así 
que si entendemos Go (con centro de simetrías 0) entenderemos el grupo original G. 
Simplificando nuestra notación, suponemos en adelante que G tiene como centro de 
simetría el origen, que todos sus elementos dejan fijo el O y, por lo tanto, que es 
subgrupo de las transformaciones ortogonales. Es decir, en adelante G € O (2). 


Paso 3 (Cuando G preserva orientación). Supongamos que todos los el- 
ementos de G C O (2) preservan orientación. Entonces todos los elementos de G 
son rotaciones con un cierto ángulo O y tenemos una nueva enumeración natural (no 
necesariamente la que habíamos usado, salvo la primera) usando sus ángulos: 


G = FRe., Ro, Res) --- Ron ¡» 
donde 0 00 <01<B02<--**<0B,-1 <2r. 
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Queremos demostrar que 9; = 2711/n y que 0; = 101, lo cual es justo decir que G = Ch, 
que G es el grupo cíclico de orden n generado por la rotación R2x/n. Puesto que 8; 
es el más chico de estos ángulos (positivos) y todos sus múltiplos 20,,301,... están 
en el conjunto de ángulos de G (pues se obtienen al componer Ra, consigo misma), 
entonces la primera vez que k8¡ exceda a 27T tiene que ser justo por 0, y después de 
haber pasado por todos los 0;; es decir, 0; = 211/n. 

Paso 4 (Jaque mate). Supongamos, por último, que algún elemento de G, 
digamos que fo, no preserva orientación. Consideremos el subgrupo de G que sí 
preserva orientación, y llamémosle G*; es decir, sea 


G* :=([g € G | det (9) = 1). 


Claramente G* es un grupo (contiene a la identidad y tanto el producto como los 
inversos de transformaciones que preservan orientación preservan orientación) que, 
por el paso anterior, es un grupo cíclico C,, para alguna m < n (como hasta ahora, 
n es el orden del grupo G, es decir, n =G). 

Primero veamos que 2m = n. En el Paso 1 definimos la biyección de G “multi- 
plicar por _”; veamos qué hace uy, (multiplicar por nuestro elemento dado que no 
preserva orientación). Al componer con una transformación que invierte orientación 
(fo ), a una que la preserva (g € G*) nos da una que la invierte (u;, (g) £ G*) y a 
una que la invierte (g £ G*), resulta que preserva (uy, (g) € G*); podemos resumir 
este trabalenguas como 


geG” % qu, (9) G*. 


Esto quiere decir que 1, es una biyección entre G* y su complemento, G” digamos 
—y vale la notación aunque no sea grupo—, de tal manera que ambos tienen el mismo 
número de elementos, m habíamos dicho, y entonces n = 2m. Por el paso anterior, 
G* es cíclico de orden m y está generado por la rotación R2x/m- 

Por otro lado, como G € O(2), fy tiene que ser una reflexión en una línea l, que 
pasa por el origen. En el Ejercicio 3.82 se pidió demostrar analíticamente que fo o Ra 
es la reflexión en la línea R_gy2 (lo). Geométricamente, si aplicamos fo o Re a está 
última línea, Ra la gira a la que está a un ángulo 0/2 más allá de ly y luego fo la 
regresa a su lugar, así que es cierto lo que se pidió (aunque no hayan hecho su tarea). 
De tal manera que 


fi := Hr, (Rzn/m) = fo O Ran/m € G” 


es la reflexión en la recta l cuyo ángulo hacia l, es 1/m. Por nuestra definición 
de grupo diédrico, las reflexiones fo y f¡ generan a D,,; pero también generan a G 
y al verlo concluiremos. A saber, R>x/m se obtiene como fo o f¡, pues fp = Leo así 
que generan a G* (generado por R2x/m) y luego cualquier elemento de G” se obtiene 
como Hy, (g) = fo o g para algún g € G*. Así que G = D,, y “colorín colorado, el 
Teorema de Leonardo ha quedado demostrado”. Ol 
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Vale la pena hacer notar de la demostración anterior que, aunque el grupo cíclico 
quede totalmente definido al fijar su centro de simetría (la € que encontramos en 
el Paso 1), o bien que esté conjuntistamente determinado como subgrupo de O(2), 
no sucede lo mismo para el diédrico, o los diédricos para ser más claros. Nótese 
que nunca usamos el ángulo de la recta £ (el espejo básico) en la que se basó (valga 
la redundancia) el final de la demostración. Para cualquier recta l que pasa por el 
origen funciona la demostración y tenemos una instancia, conjuntistamente distinta, 
del diédrico. Si queremos el diédrico con fl igual al eje de las x, tendremos que 
conjugar, como en el Paso 2, pero ahora con la rotación que lleva l a la recta canónica. 


Quizá quede más claro a qué nos referimos con eso de “instancias” de un cierto 
grupo si enunciamos el Teorema de Leonardo como “un grupo finito de isometrías es 
conjugado del cíclico (Rar/n) o del diédrico En que fue, junto con la obser- 
vación precedente, lo que realmente demostramos. 


EJERCICIO 3.104 Identifica el grupo de simetrías de las siguientes figuras y, a ojo de 
buen cubero, píntales su centro de simetría. ¿Qué algunas no tienen tal? ¿Dónde está un 
error formal (no esencial) de la demostración anterior? Corrígelo. 


¿ERRE 


Leonardo afín 


El ojo humano, y la naturaleza en general, identifica simetrías aunque, estrictamente 
hablando, no las haya; vemos el bulto y no nos preocupamos por los milímetros; el 
ejercicio anterior tiene sentido aunque es seguro que en el dibujo, o en la impresión, 
se cometieron errores; el cuerpo humano tiene simetría D¡. E igualmente existe la 
simetría más allá del rígido grupo de isometrías. 


Supongamos que una figura F tiene grupo de simetrías G (será D¿ en la figura que 
viene). Si f es una transformación afín que no es isometría, entonces f (F) (ahora sí: la 
figura) ya no tiene, en general y estrictamente hablando, las mismas simetrías. 
Sin embargo, es evidente que sí las tiene: las vemos, las detectamos: tiene 
simetría afín. Podemos definir el grupo de simetría afín de (cualquier figura) 
F (luego regresamos a nuestro ejemplo, f (F)) como 


Simas (F) =1g € Af (2) | g (F) =F) 


dibujo arriba 
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y la demostración de que es un subgrupo de Af (2) es, verbatim,* la de que 
Sim (F) es subgrupo de Iso (2). 
En nuestro ejemplo (f (F) , el dibujo de al lado), Simag (f (F)) será justo el 
conjugado por f”! del grupo G = Sim (F); que, puesto que f no es isometría, 
simplemente es afín, sólo es un subgrupo de las transformaciones afines. Veamos. Si 
g € G entonces 


(fogof) (F(F) = (fog)(f” ( 


implica que (f ogo O) € Simar (f (F)). Hemos demostrado que 
foSim(F)of? C Simar (f(F)), 


donde estamos extendiendo naturalmente nuestra definición de grupo 

conjugado (dada en el Paso 2 del Teorema de Leonardo) al contexto 

más amplio de cualquier grupo (en nuestro caso a Af (2)). Intentemos demostrar la 
otra contención, pues habíamos aventurado justo la igualdad. 

Si g € Simaf (f (F)), entonces un cálculo equivalente, aunque más fácil, implica 
que (fo gof) (F) = F. Pero de esto no podemos concluir que (f'ogof) € 
Sim (F) sino sólo que (a ogo f) € Simar (F), pues no sabemos si e ogo 7 es 
isometría o no: en principio, es simplemente afín. Habíamos aventurado la igualdad 
justa en el caso concreto del dibujo f (F) que estamos estudiando, porque a simple 
vista es evidente: el “chuequito” f (F) tiene únicamente las 12 simetrías afines que 
corresponden a las 12 simetrías métricas del “redondito” F. Y aunque no lo hayamos 
podido demostrar en el primer intento, surgen las preguntas naturales de si los grupos 
de simetrías afines de las figuras acotadas (versión topológica) o si los subgrupos 
finitos (versión grupera) se comportan como los rígidos (teoremas de Leonardo). Más 
en concreto, y en base a lo que hemos logrado con isometrías, olvidándonos de las 
figuras y concentrándonos en los grupos, nos debemos hacer dos preguntas: 


Pregunta 1. Si G es un subgrupo finito de Af (2), ¿será cierto que es isomorfo 
a un cíclico o un diédrico? 


Pregunta 2. Si G es un subgrupo finito de Af (2), ¿será cierto que es conjugado 
del cíclico (Rar/n) o del diédrico (Es Eto) para alguna n? 

Dejamos estas preguntas al lector, pues gran parte del trabajo ya se hizo. Por 
ejemplo, el Paso 1 en la demostración de Leonardo funciona verbatim en el caso afín 
(de hecho sólo en esa cualidad se basó); y ya que lo mencionamos, ahí está el error 
que dejamos buscar como ejercicio: para que el centro c esté bien definido, que no 
dependa de Xx, se necesita que el grupo tenga más de dos elementos. Y el Paso 2, 
irse al origen, es igual, pero acabamos obteniendo que G es subgrupo de GL (2) en 
vez de O (2). Los problemas aparecen en el Paso 3 que aparentemente se basó en 


3Dícese de cuando es literalmente idéntica, salvo los cambios obvios. 
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sumas, restas y desigualdades de ángulos como números reales, pero en el fondo son 
una forma más mundana de trabajar con la estructura de grupo, y el orden cíclico 
que dan se puede obtener al tomar la órbita (Gx = [g (x) | g € G)) de algún punto. 
Algunos de los ejercicios siguientes pueden ayudar. 


EJERCICIO 3.105 Sea g € GL* (2) (donde GL* (2) :=([g € GL (2) | det (g) > 0)), tal 
que para algún vector v € R?, v 4 0, se tiene que g (v) = tv. Demuestra que si g tiene 
orden finito, es decir, que si g" = id para alguna n, entonces g = id o bien g = —id. 
(Primero demuestra que t= +1 pensando en la acción de g sobre la recta generada por v, 
(v); y luego usa la hipótesis de que preserva orientación: toma algún vector fuera de (v) y 
expresa lo que le hace 9). 


EJERCICIO 3.106 Demuestra que si G C GL* (2) es finito, entonces Gv = 
tg (v) | g € G) tiene la cardinalidad de G para cualquier v % 0. Y que además se tiene 
que si g (v) es paralelo a h (v) para algunos g y h en G, entonces g = ho bien g =—h (ojo: 
en este último caso, sus ángulos son opuestos). 


EJERCICIO 3.107 Sea g € GL (2), g 4 id; demuestra que su conjunto de puntos fijos, 
fx ER? |g(x) = xp, es una recta que pasa por el origen o sólo el origen (revisa la Sección 
8.1). Concluye que los puntos fijos de una transformación afín distinta de la identidad son 
el vacío, o un punto o una recta. 


EJERCICIO 3.108 Demuestra que Simaf (s!) = O(2) =Sim (s)); es decir, que toda 


simetría afín del círculo unitario es una isometría. 


EJERCICIO 3.109 Sea € la elipse dada por la ecuación 


2 2 
ES, 
a b? 


Demuestra que Simar (€) es conjugado de O(2) (para esto, encuentra una matriz que 
mande a S! en €). 


3.9.2 Grupos discretos y caleidoscópicos 
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Los teoremas tipo Leonardo hablan de las posibles simetrías de las figuras acotadas. 

Pero además hay figuras infinitas que tienen simetría, y de ellas, más bien de sus gru- 

pos, queremos hablar en esta sección. Las más comunes son los pisos por 

los que caminamos a diario y las paredes que nos rodean. Aunque no sean 

infinitos, una pequeña porción sugiere claramente cómo debía continuarse a 
de tal manera que cada región sea “igualita” a cualquier otra. Tienen, o 

dan la idea, de una “regla” para ir pegando piezas que llamaremos losetas 
y que juntas todas ellas llenan el plano. A tal descomposición del plano en 
losetas la llamaremos un mosaico; cada loseta es copia isométrica de una 
o varias que forman el muestrario; por ejemplo, en el mosaico de en medio 
un “ladrillo” rectangular y un “huequito” cuadrado forman el muestrario 
y en los otros dos el muestrario consta de una sola pieza. Con una sola 
pieza se pueden armar varios mosaicos (ver otros ejemplos, además de los 
dos al margen, en el segundo ejercicio que viene, el 3.111) usando diferentes 
“reglas”. Y esto de las “reglas” ya lo conocemos: consisten en el fondo de dar un sub- 
grupo de isometrías; que llamaremos el grupo de simetrías del mosaico: las isometrías 
que lo mandan en sí mismo (que dejan a la figura completa —aunque infinita— en 
su lugar). 


Un último y sugestivo ejemplo, antes de entrar a la teoría, surge de los caleido- 
scopios clásicos que en su versión física, real, consisten de tres espejos rectangulares 
del mismo tamaño que forman un prisma triangular equi- 
látero, de tal manera que al observar desde un extremo de 
él, la figura plana al otro lado (que puede ser cambiante) 
se reproduce para dar la impresión de un plano infinito. 
Este es otro ejemplo de un mosaico plano. Podemos pen- 
sar en una figura plana (la figura fundamental) dentro 
de un triángulo equilátero de líneas espejo: ésta se re- 
produce por las tres reflexiones y sus composiciones para 
tapizar todo el plano y generar una figura caleidoscópica; 
como mosaico, el muestrario consiste de una loseta que 
es el triángulo equilátero con un dibujo. 


El grupo de simetrías de este mosaico es el conjunto de todas las posibles com- 
posiciones de las tres reflexiones básicas o generadoras; y un elemento del grupo lleva 
a la figura (o loseta) fundamental a una cierta loseta, que no sólo es un triángulo de la 
descomposición del plano en triángulos equiláteros, sino que la figura (en el dibujo, el 
“manquito”) le da una orientación y una posición específicas. En su versión física, la 
composición que produce una cierta loseta tiene que ver con los espejos y el orden en 
que rebota el rayo de luz que emana de la figura real para producir la imagen dada. 

Basta de ejemplos (ojéense los ejercicios) y hagamos algo de teoría. Por nuestra 
experiencia reciente, será más facil definir con precisión a los grupos involucrados en 
los mosaicos que a los mosaicos mismos (se necesitarían rudimentos de topología). 
Pero la intuición y los ejemplos bastan. Aunque los grupos de simetría de los mo- 
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saicos sean infinitos, tienen la propiedad de que localmente son finitos; cada punto del 
plano está en un número finito de losetas. Esto se reflejará en la primera propiedad de 
nuestra definición. Y otra cosa importante es que las losetas sean acotadas, que ex- 
presaremos como la propiedad dos. Llamaremos disco a un círculo (de radio positivo) 
junto con su interior, es decir a los conjuntos de la forma D = fx ecR?Id(x,e)< r] 
para algún punto € € R? y algún r > 0. 


Definición 3.9.1 Un subgrupo 6 de las isometrías Iso (2) es un grupo cristalográfico 
si cumple: 


i) Para cualquier disco D se tiene que el conjunto (g € G| g(D)ND 4 9) es finito. 


ii) Existe un disco Doy tal que Usec 9 (Do) = R?, es decir, tal que para todo x € R? 
se tiene que x € g(Do) para alguna g € G. 


La primera propiedad dice que al estudiar un grupo cristalográfico dentro de una 
región acotada del plano sólo intervendrá un número finito de elementos del grupo; 
a esto también se le llama que el grupo sea discreto. Y la segunda, que al entender 
una región suficientemente grande, pero acotada, de alguna manera ya acabamos; el 
grupo se encarga del resto. Un ejemplo importante son los subgrupos generados por 
dos traslaciones en direcciones independientes, por ejemplo en los vectores canónicos 
e y e, que da lugar a un subgrupo isomorfo a Z x Z (en el ejemplo son precisamente 
las traslaciones por vectores en Z? CR?). 

El nombre “cristalográfico” viene de que los cristales en la naturaleza se repro- 
ducen respetando ciertas simetrías; los químicos, interesados en el asunto, se pusieron 
a estudiar tales simetrías y demostraron, hacia el final del siglo XIX, que en el 
plano solamente había 17 posibilidades teóricas para estas reglas de crecimiento. Los 
matemáticos, ya en el siglo XX, pulieron sus observaciones y la demostración, pero 
preservaron el nombre dado por los químicos. 

La demostración de este teorema involucra dos grandes pasos: la existencia (ex- 
hibir los 17 grupos cristalográficos) y la unicidad (demostrar que no hay más). Pero 
resulta que los artistas y artesanos árabes —cuya expresión gráfica se centró mucho en 
los mosaicos, la simetría y la ornamentación pues en cierta interpretación del Corán 
se prohibía representar la figura humana— ya habían hecho (¡y de qué manera!) la 
mitad del trabajo: en la Alhambra, hay ejemplos de mosaicos con los 17 grupos. Así 
que la demostración de la existencia está en la Alhambra, concluida en el siglo XVI; 
y si hay un Teorema de Leonardo, éste —digo yo— debía ser el de la Alhambra. 

No tenemos tiempo para demostrarlo aquí. Pero sí podemos ejemplificar su 
demostración con uno mucho más modesto. Diremos que un grupo cristalográfico 
G es caleidoscópico si además cumple con que tiene suficientes reflexiones como para 
generarlo, es decir, si cada elemento de G puede escribirse como composición de re- 
flexiones en G. Un ejemplo es el que describimos arriba, que estaba generado por tres 
reflexiones y que denotaremos como K3 3 3 pues las líneas de sus espejos se encuentran 
en los ángulos 711/3,71/3,71/3. 


Dibujo 


Dibujo 


Dibujo 
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Otros dos grupos caleidoscópicos surgen del juego de escuadras. Con tres lineas 
espejo en los lados de un triángulo de ángulos 711/6, 71/3,71/2 (la escuadra “30, 60, 90”) 
se genera el grupo Kg32; y con tres espejos en ángulos 71/4,711/4,71/2 (la escuadra 
“45”) el Ky42. El último, que llamamos K4x4, es el generado por espejos en los 
cuatro lados de un rectángulo. Y, salvo ver que efectivamente son cristalográficos en 
cuyos detalles no entraremos (construyánse modelos con espejos reales), esto concluye 
la parte de existencia del siguiente teorema 


Teorema 3.27 Hay cuatro grupos caleidoscópicos, que son Ks 32, K442, K333 Y Kaxa - 


La demostración de la unicidad se basa en un lema general sobre los centros 
de simetría. Dado un grupo cristalográfico G (aunque de hecho sólo usaremos que 
es discreto, la propiedad (i)) tenemos que para cualquier punto x € R? hay un 
subgrupo de G, llamado el estabilizador de x y denotado con St (x), que consta de 
los elementos de G que no mueven a Xx, que lo “estabilizan”, es decir, 


Sto (x) :=[g € G| g(x) =x). 


(Es fácil demostrar que efectivamente es un subgrupo de G.) Si tomamos cualquier 
disco D centrado en x, todos los elementos de su estabilizador mandan a D pre- 
cisamente en D, pues fijan su centro y son isometrías. Por la propiedad (i) los que 
mandan a D cerca (lo suficiente para intersectarlo) ya son un número finito, entonces 
Stá (x) es finito para cualquier x € R?. El Teorema de Leonardo nos da entonces el 
siguiente lema. 


Lema 3.28 Si G es un grupo discreto, entonces sus subgrupos estabilizadores no 
triviales son cíclicos o diédricos. Ol 


Ahora sí, enfoquemos nuestras baterías contra el teorema de los grupos calei- 
doscópicos. Como el grupo G tiene suficientes reflexiones para generarlo, nos podemos 
fijar en el conjunto de sus líneas espejo. Es decir, para cada reflexión en G, pintamos 
de negro su línea espejo; llamemos £ a este conjunto de lineas. Primero vamos a 
demostrar que podemos encontrar un triángulo o un rectángulo formado por líneas 
negras (en £) tal que ninguna línea de £ pasa por su interior y lo llamaremos la región 
fundamental. 

Si todas las líneas de £ son paralelas, los elementos de G mueven cualquier disco 
en la dirección perpendicular y entonces cubren a lo más una franja del tamaño de 
su diámetro en esa dirección y no existiría el disco Dy de la condición (ii). Hay, por 
tanto, al menos dos pendientes en £. 

Si son exactamente dos las pendientes en £, éstas tienen que ser perpendiculares, 
pues con reflexiones en dos rectas no ortogonales se generan reflexiones en líneas con 
nuevas direcciones. En este caso, hay al menos dos rectas de cada tipo, pues si hay 
sólo una de un tipo, con cualquier disco se cubre, de nuevo, a lo más una franja. 
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Existe entonces un rectángulo en £. 

Si hay rectas en tres direcciones tenemos un triángulo. Llamemos F' al rectángulo 
o triángulo que hemos encontrado. Puesto que las reflexiones en G que mandan a F' 
cerca son finitas (la condición (1) aplicada a un disco que lo contenga), hay, a lo más, 
un número finito de rectas en £ que pasan por el interior de F'. Recortando con tijeras 
en todas ellas, un pedacito (cualquiera) de lo que queda es la región fundamental F 
que buscábamos, y ya no pasan lineas negras por su interior. 

Veamos ahora cómo puede ser la región fundamental F. En un vértice, v digamos, 
se intersectan dos líneas de £ de tal manera que en su ángulo definido por F (como 
ángulo interior) no hay ninguna otra línea de L. Como las reflexiones correspondientes 
a estas dos líneas son elementos del grupo estabilizador de v, Sta (v), y éste es diédrico 
o cíclico según el Lema 3.28, entonces es diédrico (pues tiene reflexiones) y el ángulo 
interior de F en v es de la forma 11/n. Por lo tanto, F tiene que ser un rectángulo (con 
cuatro ángulos 711/2), o bien un triángulo con ángulos 1/p,71/q,71/r donde podemos 
suponer que p < q < r. En el segundo caso se tiene entonces que p, q,r cumplen 


1. 1 7] 

—=+-=+-=1, 

Pp. q)o7r 
pues los ángulos de un triángulo suman TT. Para p = 2, tenemos las soluciones q = 3, 
r=6y q == 4; para p = 3 tenemos la solución q =r= 3 y para p > 4 ya no hay 
soluciones. 

Entonces hemos demostrado que los lados de F generan uno de los grupos K4x4, 
Ks32, Kg42 O K333 (respectivamente a su orden de aparición) y por lo tanto que 
uno de estos grupos, el correspondiente a F, digamos que G”, está contenido en G. 
Dejamos demostrar que G' = G al lector intrigado; tendrá que usar sustancialmente 
que las reflexiones generan a G. 


EJERCICIO 3.110 Identifica las líneas de simetría (espejos de reflexiones y líneas de 
pasos en el grupo de simetrías) y los centros de simetría (centros de subgrupos finitos), de 
los siguientes mosaicos comunes, que, por supuesto, suponemos infinitos. 


E 


EJERCICIO 3.111 —Supón que en los siguientes mosaicos la loseta oscura está justo en 
el cuadrado unitario. Da generadores para sus grupos de simetría. 


3Para leer más sobre simetría y mosaicos ver [15], [8] y [11]. 


Rearmar 
figura co 
mosaiquito 
asimétrico 
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3.93 Fractales afinmente autosimilares 


Veremos por último algunas figuras que tienen cierta “simetría” aunque no dentro del 
grupo de isometrías. 


Espirales 


Consideremos una espiral infinita. Claramente tiene autosemejanzas: siente uno que 
“sira y crece proporcionalmente”. En efecto, el grupo “espiral” 


E. =[c Ri |teR), 


donde c > 0, es un subgrupo de las semejanzas y es isomorfo al 
grupo de los reales con la suma para cualquier c 4 1, pues 


(c* Res) o (c* Ron) = qn Rít+r a 


Para cualquier punto x % O, su órbita E, (x) = (f(x) | f € E.) 

es una espiral invariante bajo el grupo, es decir, su imagen bajo 
cualquier elemento del grupo es ella misma. Los distintos valores de c dan qué tan 
rápido crece la espiral y en qué orientación. 

Especialmente bonita, y que además se da en la naturaleza, es la espiral áurea 
que crece la proporción áurea (Y en un cuarto de vuelta y entonces en nuestra fórmula 
anterior corresponde a c = q?. La proporción áurea, descubierta y ampliamente usada 
por los griegos que también la llamaban “proporción divina”, es la proporción de los 
lados de un rectángulo tal que si se le extrae un cuadrado sobre el lado chico nos queda 
un rectángulo semejante al original. Nótese que en 
la figura clásica de al lado, considerando que en ella 
está también la sucesión infinita de cuadrados a la 
que alude, tiene como grupo de simetrías afines o de 
semejanzas al generado por la transformación líneal 


(e 2) 


(poniendo al origen en el centro de la espiral), que 
es un subgrupo isomorfo a Z dentro de Ej». 


H— 1 A 


EJERCICIO 3.112 Demuestra, usando la definición que acabamos de dar, que la pro- 
porción áurea cumple con la ecuación 


x2=x+1 
y por tanto que Y = (1 +5) /2 =1.61803. 


EJERCICIO 3.113 Si en la figura anterior el cuadrado superior derecho es el cuadrado 
unitario, ¿dónde está el centro de la espiral? 
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Fractales autosimilares 


Si tomamos una espiral desde su centro hasta algún punto dado, entonces al hacer 
un zoom hacia el centro, sin importar de qué tanto aumento, volvemos a encontrar 
una copia de la figura original. Veremos ahora cómo definir figuras que cumplen esto 
pero alrededor de cualquiera de sus puntos. 

Consideremos primero el ejemplo clásico conocido como el Triángulo de Sierpinsky. 
Sea Zo un triángulo equilátero y sean f1, f2 y f3 las contracciones de 
factor 1/2 centradas en sus tres vértices. Tomamos Z¡ como la unión 
de las tres imágenes de Zo bajo estas tres homotecias; y en general, 
definimos Z, inductivamente como 


al = f: (Zn) UÚ f (Lal U f3 (e) . 


En la figura vemos hasta Z;7. El triángulo de Sierpinsky Z es el límite 
de los Z,, O bien, como Znp+1 C Zn, también es la intersección de 
todos ellos, así que, por ejemplo los tres vértices originales están en 
Z así como todos los vértices de todos los triángulitos (3") en cada 


paso. La propiedad importante que cumple Z es que si magnificamos EN £ 
pequeñas porciones en cualquier lugar vemos copias del original, y £ E a fe 
se dice que es un fractal autosimilar; en este caso, podemos añadir de AAA 


autosemejante pues con zooms basta. 

La clave es que las tres transformaciones afines que consideramos contraen en 
todas las direcciones y cumplen entonces que independientemente de con qué conjunto 
acotado empecemos (en vez de Zp) el límite es el mismo (aunque ya no se obtenga 
por intersección). No lo demostraremos aquí, pero ponemos dos dibujos del principio 
de la sucesión correspondiente a otros dos conjuntos, uno un cuadradito dentro del 
triángulo Zo (que se mantiene en gris al fondo) y el otro un cuadrado grande fuera 
de él. Después de unos cuantos pasos, las tres figuras ya son casi indistinguibles. Así 
que Z está realmente asociado a las tres semejanzas (reductoras) f¡, f2 y f3, y no 
depende del conjunto acotado con el que empezamos. 
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Si en vez de semejanzas tomamos transformaciones afines que contraigan en todas 
las direcciones, es decir, que cumplan la desigualdad 


d(f(x),f(y)) <d(x,y) para toda x, y € R? con x + y, (3.18) 


se tiene que la figura límite queda compacta y bien definida (teorema que no demos- 
traremos). Así se obtienen fractales afinmente autosimilares. 

Otro ejemplo interesante es el helecho de la figura siguiente. Está asociado a las 
tres transformaciones afines 91, 92 y 93 que mandan al triángulo F, del primer cuadro 
en los tres triángulos del segundo respectivamente (en gris se mantiene el cuadrado 
unitario para mostrar proporciones y de los segmentos hablaremos en breve). Y de 
nuevo se define inductiva o recursivamente 


Pl = 91 15) U g2 (Fr) U 93 (Ex) 


para obtener el “follaje” F como el límite de los conjuntos F,, (en la figura aparece 
hasta Fg); otra vez no depende del conjunto inicial Fo sino unicamente de las tres 
transformaciones. (Puesto que reducen área, las tres transformaciones tienen deter- 
minante con valor absoluto menor que 1 y una de ellas lo tiene negativo: ¿puedes 
decir cuál? se aprecia hasta el tercer cuadro.) Obsérvese que los tallos del helecho se 
obtienen de una manera sutilmente diferente. Si To es el segmento vertical del primer 
cuadro, entonces a la siguiente iteración también se le añade lo que ya llevabamos 
—<Crece, por decirlo botánicamente, sobre lo ya construido—; esto es, definimos 


pe = es U 91 (T,,) U 92 (Tr) U 93 (Tr) 


y entonces el resultado final T (el límite) sí depende de con qué empezamos (y con 
ese pequeño intervalo se logra el efecto, de “tallo”, deseado). 
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Llamemos H = TUF al helecho. Las tres funciones generadoras g1, 92, 93 lo 
mandan en sus tres ramas principales, las composiciones de un par de ellas lo mandan 
en sus 9 “ramas secundarias”, y así sucesivamente. Si consideramos todas las posibles 
composiciones finitas de 91, 92, 93, junto con la identidad se obtiene un semigrupo 
(algunos autores lo llaman grupoide) que cumple con dos de los axiomas de grupo. 
A saber, tiene a la identidad y es cerrado bajo composición, pero no tiene inversos; 
de alguna manera, es el análogo de los grupos de simetría para este tipo de fractales. 
Y cualquier elemento g de este semigrupo cumple que g(H) € H; manda al helecho 
completo en una ramita por ahí que es afinmente equivalente a H. 

Como ya mencionamos, es importante que las tres transformaciones afines que 
usamos para definir el helecho sean contracciones; en particular, entonces F tampoco 
depende de con qué figura acotada hayamos empezado. Esbozaremos por último, 
algunas de las ideas que indican el porqué de este hecho. 

Primero, para una transformación afín f(x) = Ax + b, que sea una contracción 
(que cumpla (3.18)), implica algo más fuerte que llamaremos contracción fuerte que 
es que existe una constante c, Ó< c<l para la cual 


d(f(x),f(y)) <c d(x,y) para toda x, y ER? con x 4 y. (3.19) 


Pues la parte lineal es la que determina las distancias porque 
IF) —f (y)! =|(Ax+b) — (Ay + b)| =|Ax — Ayl; 


y entonces basta ver qué le hace A al círculo unitario. Como quedará claro 

en el capítulo siguiente, A lo manda en una elipse centrada en el origen y si 

se cumple (3.18) para x = 0 entonces esta elipse está contenida en el círculo 

unitario y su semieje mayor c < 1 sirve como la constante mínima que cumple (3.19). 
Con (3.19) se puede demostrar en general que una contracción fuerte f tiene un 

punto fijo p. Para una función afín esto es más fácil (véase el Ejercicio 3.115). Y 

entonces para cualquier x se tiene que la sucesión f” (x) tiende (se acerca indefinida- 

mente) a p, pues si d es la distancia de x a p, es fácil ver que 


d(f" (x),p) <c"d=>0 


(obsérvese que esto no necesariamente es cierto si sólo se cumple (3.18)). Así que las 
iteraciones bajo f de cualquier conjunto acotado se van aproximando a p y lo tienen 
como límite. Esto implica que el punto fijo de cualquier transformación en los dos 
semigrupos “contractivos” que hemos considerado va a aparecer en el límite (Z o FP), 
y que también lo harán sus imágenes bajo otros elementos del semigrupo. Pero quizás 
aparezcan más puntos. Por lo menos, esto medio explica por qué el conjunto inicial 
no importa para definir el fractal. 

Por último, hay que mencionar que esto de los fractales es mucho más amplio. 
Hay de muchos otros tipos y aún la terminología no está bien establecida pues en las 
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últimas décadas ha habido mucho trabajo sobre ellos y su sorprendente similitud con 
la naturaleza. 


EJERCICIO 3.114 Sea f;¡ la transformación afín definitoria del helecho H asociada a 
su rama principal, es decir, que manda al triángulo Fy en el más grande y más alto de los 
tres en F;, el central, pues. ¿Cuál es su punto fijo? ¿Puedes determinar los puntos fijos de 
las otras dos? (Uno es fácil y el otro más escurridizo.) ¿De alguna composición doble? 


EJERCICIO 3.115 Seaf (x) = Ax+b una función afín de R? en R? que no tiene puntos 
fijos. Demuestra que entonces existe un vector v % O para el cual Av = vw. (Usa que la 
ecuación f (x) =x es equivalente a (A — 1)x =—b y en el Teorema 3.21.) 


EJERCICIO 3.116 Usando el ejercicio anterior, demuestra que una contracción afín 
(que cumple (3.18)) tiene un único punto fijo. 


3Como bibliografía general sobre fractales, véanse [18] y [19]. 
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Capítulo 4 


Cónicas II (clasificación) 


En el Capítulo 2 se introdujeron las cónicas (círculos, elipses, hipérbolas y parábolas) 
como los lugares geométricos de puntos en el plano euclidiano que cumplen cierta 
propiedad descrita en términos de distancias. De esa descripción se dedujo que son 
los conjuntos de puntos cuyas coordenadas cumplen cierta ecuación cuadrática. Una 
ecuación cuadrática de éstas se puede considerar como un polinomio cuadrático (de 
grado dos) en dos variables (las coordenadas) igualado a 0. Al tomar cónicas en 
diferentes posiciones y con distintos parámetros se obtendrán diversos polinomios. 
La pregunta que guía este capítulo es la pregunta inversa: 

¿Será cierto que cualquier polinomio cuadrático en dos variables define una cónica? 
Si es así, ¿cómo saber qué tipo de cónica es y cuál es su descripción geométrica? 

Por su parte, en el Capítulo 3 estudiamos diferentes grupos de transformaciones 
geométricas. Ellos nos darán la herramienta y el lenguaje para atacar y entender el 
problema que nos acabamos de plantear. 


4.1 ¿Qué es clasificar? 


Muy en general, “clasificar” es describir o enumerar las clases de equivalencia de 
un conjunto de objetos de acuerdo con ciertos “criterios” que definen una relación 
de equivalencia entre ellos. En nuestro caso, de lo que depende una “clasificación” 
es de determinar un conjunto de objetos geométricos (triángulos, digamos, como 
ejemplo para fijar ideas) y de establecer una noción de equivalencia, es decir, definir 
las condiciones en que estamos dispuestos a decir que dos objetos son “iguales”, o, 
mejor dicho, equivalentes. En esto último, la noción de grupo de transformaciones 
que hemos desarrollado es básica. Concretemos. 

Una figura plana es cualquier subconjunto F € R?. Sea G un grupo de transfor- 
maciones de IR? (nos interesan principalmente los que ya hemos definido, es decir, G 
puede ser el grupo afín Af(2); el general lineal G1(2); el grupo de semejanzas; el de 
homotecias; el de isometrías Iso(2); el de transformaciones ortogonales O(2), o el de 
traslaciones). Decimos que dos figuras F¡ y F2 son G-equivalentes (o bien, que son 
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equivalentes módulo G) y lo denotamos F; a Fz, si existe g € G tal que g(F;¡) = F2. 
La terminología se puede hacer a veces más simple; por ejemplo, dos figuras son se- 
mejantes (o isométricas) si son equivalentes módulo semejanzas (o, respectivamente, 
Iso(2)-equivalentes). 

Veamos primero que ésta es efectivamente una relación de equivalencia, demos- 
tración que corresponde puntualmente a que G es un grupo de transformaciones: 


i) Z es refexiva (F E F); pues id(F) = F y la función identidad, id, está en G. 


ii) Ss es simétrica (F; E E=>FP ES F¡); pues si existe g € G tal que g(F;¡) = Fa 
entonces g?(F>) =F¡ y g| € G. 


iii) S es transitiva (F; pe E y PR ES Es. => Fi ss F3); pues si gi(F¡) = F2 y g2(F>) = Fz 
con g1, 92 € G, entonces (g2 o g1)(F¡) = F3 y (g2 0 91) € G. 


Además, estas relaciones se “anidan” de acuerdo con la contención de grupos; 


] : H G PR . 
es decir, si H € G entonces F¡ = FE? > F¡ = F2. Así, si, por decir algo, dos fig- 
uras son isométricas, también serán afinmente equivalentes (pero no necesariamente 
linealmente equivalentes). 


4.1.1 Clasificación de triángulos 


Para acabar de entender con un ejemplo concreto, describamos la clasificación de 
triángulos. Primero hay que definirlos: sea 7 el conjunto de triángulos planos, es 
decir, ternas (no ordenadas) no colineales de puntos en ¡R?. El Teorema 6.4 nos 
dice que “hay un sólo triángulo afín”, es decir que cualquier par de triángulos son 
afinmente equivalentes. 

Esta única clase de equivalencia afín se parte en muchas subclases cuando vemos 
los triángulos con “ojos de semejanza”. Pues, si alguna de las seis transformaciones 
afines que mandan un triángulo en otro es una semejanza, entonces éstos tienen los 
mismos ángulos, e inversamente. Así que el teorema “dos triángulos son semejantes 
si y sólo si sus ángulos son iguales” es un “teorema de clasificación” que dice que hay 
una clase de semejanza por cada terna (no ordenada) de ángulos x, $, y que cumple 
a>0p>0y>0ya+p+y= . 

De nuevo, las clases de semejanza se parten en clases de isometría de acuerdo 
con un parámetro real y positivo (el tamaño) que podríamos tomar como el área del 
triángulo o la longitud de un lado dado. Y podríamos de nuevo partir estas clases de 
isometría en clases módulo translaciones (y aparece un parámetro de “orientación” 
y uno de “dirección”), o bien en clases módulo ortogonales (y aparece un parametro 
de “distancia al origen”). Llegando al extremo de la clasificación con el grupo trivial 
((id)) donde dos son equivalentes si son estrictamente el mismo. 
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4.2 Clasificación de cónicas 


Primero que nada, un polinomio de segundo grado (o cuadrático) en las variables x, y 
es una expresión 


P(x,y) = ax? + bxy + cy? + dx+ey +f, 


donde los coeficientes a, b, c, d, e, f son números reales, y además al menos uno 
de a, b, c es distinto de O (si no fuera así estaríamos hablando de un polinomio 
lineal). Los primeros tres términos constituyen su parte cuadrática, los siguientes dos 
su parte lineal, y por último f es la parte constante. Nótese que al monomio bxy se 
le considera de grado 2 pues es la suma de los exponentes de las dos variables. Á un 
polinomio cuadrático se le puede pensar también como una función P : R?= R donde 
a un punto dado x € R? se le asigna el número P(x) que resulta de sustituir en la 
expresión los valores de sus coordenadas x' = (x,y). Así que podemos hablar de los 
ceros del polinomio P, o la curva asociada al polinomio P, como un subconjunto de 
R?, a saber: 


C(P) = [x e R? | P(x) =0?. 


Diremos que un subconjunto CC IR? es una curva cuadrática si consiste de los ceros 
de un polinomio cuadrático, es decir, si para algún polinomio cuadrático P se tiene que 
C =C(P). Por el momento no queremos usar el nombre más común de “cónica”, para 
que quede claro nuestro problema, que consiste en clasificar las curvas cuadráticas 
de acuerdo con los diferentes grupos geométricos, y en particular, ver si son siem- 
pre cónicas. La parte fundamental de esta clasificación consistirá en demostrar que 
cualquier curva cuadrática es afinmente equivalente a alguna de las siguientes, que 
por el momento sirven de ejemplos. 


4.2.1 Las cónicas canónicas (y algo más) 


i) El círculo unitario. El polinomio 
yl (1) 


tiene como ceros el círculo unitario. 
ii) La hipérbola unitaria. El polinomio 


y =] (1) 


tiene como ceros la hipérbola que llamaremos unitaria. 
iii) La parábola canónica. El polinomio 


x?—y (iii) 


tiene como ceros a una parábola. 
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Por medio de transformaciones afines estas tres curvas se pueden mandar a muchas 
otras. Del círculo unitario se obtienen las elipses, y de la hipérbola y la parábola 
(que hemos escogido por la simpleza de su polinomio) se obtienen todas las demás 
hipérbolas y parábolas que estudiamos en el Capítulo 2. Pero notemos de una vez 
que con los polinomios cuadráticos se obtienen nuevos conjuntos: 

iv) El círculo imaginario. El polinomio 


x*+y?+1 (iv) 


no tiene ningún cero en los reales pues la suma de dos cuadrados es no negativa, más 
l es estrictamente positiva. Es decir, su curva cuadrática es el vacío Y C R?. La 
llamamos “círculo imaginario” pues fácilmente le encontramos soluciones complejas 
(por ejemplo 1?+02+1 = 0, donde 1? = —1) pero se nos sale del contexto de este libro; 
aunque como polinomio tiene plenos derechos y tendremos entonces que incluirlo en 
nuestro análisis. 

v) Par de rectas. El polinomio 


Xx Y (v) 


tiene como conjunto de ceros a la unión de las dos rectas x+y =0 y x—y =0; 
pues al verlo como producto (x?—y? = (x+y)(x—y)), si se hace cero entonces alguno 
de los factores debe ser cero y viceversa. 
, vi) El círculo de radio cero. Dado por el polinomio 


| x? + y? (vi) 


que define al punto O por una sola ecuación cuadrática que es el caso limite de 
círculos cuyo radio se hace cero. También podría llamarse par de rectas imaginar- 
ias pues se factoriza (x? + y? = (x + iy)(x — iy)) y se puede ver entonces como dos 
“rectas complejas” de las que sólo vemos en el plano real al origen. 
7 vii) Rectas paralelas. Por la misma razón que en (v), el polinomio 


| d x2—1, (vii) 
da dos rectas paralelas (x =1 y x =—1). 
viii) Rectas paralelas imaginarias. Dada por 
+1, (viii) 
que se factoriza x? + 1= (x+1)(x—1). 


z ix) Recta doble. Dada por 


de (ix) 


Aunque geométricamente sólo consiste de una recta (x = 0) se le llama “recta 
doble” pues el polinomio que la define es diferente. 
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4.2.2 Equivalencia de polinomios 


Para que tenga sentido el problema de clasificar curvas cuadráticas módulo transfor- 
maciones afínes, la primera pregunta que debemos responder es si las imágenes afínes 
de curvas cuadráticas son de nuevo curvas cuadráticas. 

Para esto, sean C( una curva cuadrática y g € Af(2) una transformación afín. 
Tenemos entonces que existe un polinomio cuadrático P que define a C, es decir, tal 
que C =C(P) = [x ec R? | P(x) = 0). Afirmamos que 


g(C)=[y eR*|(Pog”)(y) =0). (4.1) 
pa Ca 
Esta igualdad de conjunt d t d - a 
sta igualdad de conjuntos se demuestra por dos con: de A 
R? 


tenciones. Primera (C): cualquier punto en g(C) es de la 
forma g(x) con x € C; se tiene entonces que P(x) = 0 y por 


lo tanto ES 
(Peg Misb0) = Pla” (e) =P0)=0, 


lo cual implica que g(x) está en el conjunto de la derecha. 

Y al reves (>): si tomamos y tal que (P o g”!)(y) = 0; sea x := g”!(y), se tiene 
entonces que P(x) = P(g”'(y)) = 0 y por tanto que x € C, lo cual implica que 
y = gl(x) € g(C). Queda entonces demostrada la igualdad. 

Obsérvese que en la demostración anterior sólo se usó que C estuviera definida 
como los ceros de una función y que g fuera invertible (una transformación). Ahora 
veremos que g(C) también es una curva cuadrática. Para esto bastará ver que 
si P es un polinomio cuadrático y g una transformación afín entonces la función 
(Po g) : R?2> R también es un polinomio cuadrático (para no estar usando g”!, que 
sólo complica la notación). Puesto que las dos coordenadas de g son polinomios lin- 
eales, y se obtiene una expresión de P o g al sustituir estos dos polinomios lineales en 
las variables de P, es claro que (después de simplificar la expresión) obtendremos un 
polinomio con monomios de grado a lo más dos. Si los coeficientes de los monomios 
cuadráticos se cancelaran todos, es decir, si el resultado fuera lineal o constante, ten- 
dríamos que al volver a precomponer con g”! se vuelve cuadrático y esto es claramente 
imposible. Tuvimos que usar entonces que g es una transformación. En resumen, 
hemos demostrado el siguiente lema. 


Lema 4.1 Sea C una curva cuadrática y yg € Af(2), entonces g[C) también es una 
curva cuadrática. Además, si C =C(P) entonces g(C) =C(P o g”!). O 


Hay que observar, antes de definir la equivalencia de polinomios, que al multiplicar 
un polinomio por una constante k 4 0, sus ceros no cambian. Es decir, que C(P) = 
C(kP) cuando k % 0; pues entonces P(x) = 0 S4 kP(x) =0. 


184 CAPÍTULO 4. CÓNICAS 11 (CLASIFICACIÓN) 


Sea G un subgrupo de Af(2). Decimos que dos polinomios cuadráticos P; y P, son 


G-equivalentes, o equivalentes módulo G, escrito P E P», si existen gEGykER, 
con k % 0, tales que kP¡ = Pz o g. Que ésta es una relación de equivalencia se deja 
como ejercicio. 

De lo anterior se obtiene que polinomios cuadráticos G-equivalentes definen curvas 
G-equivalentes. El inverso, aunque es cierto, aún no lo podemos demostrar, pues 
incluye que si dos polinomios cuadráticos definen la misma curva (tienen los mismos 
ceros) entonces difieren por una constante y para esto (en general) hay que incluir los 
números complejos. Lo que sí podemos hacer es enunciar el teorema fundamental de 
este capítulo, cuya demostración nos llevará gran parte del mismo. 


Teorema 4.2 Sea P un polinomio cuadrático en dos variables x, y. Entonces P es 
afinmente equivalente a uno y sólo uno de los polinomios (1), (13),..., (iz). 


Una vez establecido este teorema, la clasificación afín de curvas cuadráticas será 
inmediata. 


Corolario 4.3 Hay ocho clases de equivalencia afín de curvas cuadráticas que cor- 
responden a los ocho dibujos de la Sección 4.2.1. 


Nótese que redujimos a ocho pues el vacío aparece en dos tipos de polinomios. 


EJERCICIO 4.1 Demuestra que para un subgrupo G de Af(2), la relación de ser G- 
equivalentes es una relación de equivalencia en los polinomios cuadráticos en dos variables. 


4.3 ¡Reducción de polinomios cuadráticos 


En esta sección veremos cómo reducir (simplificar) un polinomio cuadrático cualquiera 
mediante cambios de coordenadas afines. Para empezar, valdrá la pena simplificar la 
notación de tal polinomio usando el lenguaje matricial y vectorial que hemos desar- 
rollado. A su vez, esto nos dejará ver con nitidez cómo diferentes tipos de transfor- 
maciones afines afectan el polinomio. 

El polinomio general de segundo grado en dos variables se puede siempre escribir 
como 


P(x, y) = ax? + 2bxy + cy” + dx+ey +f, (4.2) 


donde la única diferencia con la forma anterior es que hemos puesto un 2 al coeficiente 
del término mixto (el monomio en xy) por razones que serán evidentes muy pronto. 
Si consideramos el vector variable x' = (x,y) y definimos una matriz A y un vector 


k como E S 
a 
A E 
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el polinomio P se reescribe como 
P(x) =x-Ax+k-x+f, (4.3) 


que llamaremos la expresión vectorial de P, pues 


e) 
(o 


x(ax + by) + y(bx + cy) = ax? + 2bxy + ey?, 


kx (2) (7)-a0+e 


Debe quedar claro entonces que anteponer el 2 al coeficiente mixto fue para que la 
expresión de la matriz A quede más simple. Así la matriz A, que debemos enfatizar 
que es simétrica (es decir, A = A”), representa a la parte cuadrática, mientras que 
el vector K a la parte lineal (la constante f quedó tal cual). Por ejemplo, el polinomio 
x? + 4xy + 3y? + 5x— y + 2 queda determinado por su parte constante 2, la matriz 


Ml 5 
A=() a) y el vector k= (5). 


Nuestra definición de polinomio cuadrático será ahora una expresión (4.3) con 


A=A' 40. 


Nótese que al pedir a la matriz A que sea simétrica obtenemos que la expresión 
vectorial de P (4.3) es única; se pudo haber tomado cualquier otra matriz con tal 
de que sus elementos no diagonales sumaran 2b pero la más natural, y que resulta 
única, es la simétrica y esto será importante. Una de las grandes ventajas de usar la 
expresión vectorial (4.3) en vez de la expresión en variables (4.2) es que la vectorial se 
escribe igual cuando hay más variables; sólo cambian las dimensiones de los elementos, 
y da la idea clara de que se pueden generalizar nuestros argumentos. Por ejemplo, 
para tres variables, tanto el vector variable x y el constante Kk tienen tres entradas, 
y la matriz A es simétrica de orden 3 x 3; pero en la expresión en variables faltan 
cuatro monomios a considerar (véase ejercicio abajo). Sin embargo, esta posibilidad 
no la usaremos por el momento, y seguiremos con dos variables. 

Veremos ahora cómo se afecta la expresión vectorial del polinomio cuadrático P al 
precomponer con diversas transformaciones afines, empezando por las más simples. 
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EJERCICIO 4.2 Encuentra la matriz simétrica A y el vector constante K que dan la 
expresión vectorial de los siguientes polinomios cuadráticos: 
x2+2y?—6x+4y+3 
9x? + 24xy + 16y? — 2x — 86y + 39 
2xy —=6x-—4y-4. 


EJERCICIO 4.3 Da una expresión general para un polinomio cuadrático en tres varia- 
bles x, y, z y luego define una expresión vectorial para él. 


4.3.1 Traslaciones (cómo encontrar el centro) 


Consideremos la traslación g(x) = x + h, para cualquier vector h € R?, y veamos 
cómo se escribe el polinomio cuadrático P o g, donde P está descrito por (4.3) (es 
decir, donde P (x) =x- Ax+Kk-x-+f). 


P(x+h) = (x+h) - A(x+h)+K- (x+h) +4 

= (x+h)-(Ax+Ah)+k.x+k-h+f 
x-Ax+x-Ah+h-Ax+h-Ah+k-.x+k.h+f 
x-Ax+x:-Ah+h-Ax+k-x+(h-Ah+k.h+f) 

= x-Ax+(x-Ah+h-Ax+k-x)+P(h). (4.4) 


(Po g)(x) 


Nótese que los tres sumandos de enmedio corresponden a la parte lineal, que podemos 
simplificar aún más usando dos lemas generales. 


Lema 4.4 Dadas dos matrices A y B que se puedan multiplicar, se tiene (AB)' = 
B'A!. 


Demostración. Ver ejercicios 3.86 y 4.4 (abajo). O 


Lema 4.5 Sea A una matriz simétrica (es decir, A = A') entonces para cualquier 
par de vectores Xx, y se tiene que X- Ay = Ax-y. 


Demostración. Puesto que x- Ay = x'Ay y el transpuesto de un número real 
(matriz 1 x 1) es él mismo, se tiene por el lema anterior que 


x-Ay = x'Ay=(x 'Ay)' =(Ay)'(x')' 
y ¡Alx=y!Ax=y-:Ax=Ax-y. 
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Por este lema, donde es fundamental que A sea simétrica, podemos simplificar la 
parte lineal de (4.4) para obtener 


x-Ah+h-Ax+k.x=2(Ah-x)+k.x=(2Ah+k)-x, 
de donde concluimos que 


(Po g)(x) =P(x+h) =x-Ax+ (2Ah + k) -x+P(h). 


De tal manera que si podemos encontrar h € IR? que cumpla 


2Ah+k=0 


habremos encontrado una traslación que elimine la parte lineal de P. En caso de que 
tal h exista, se le llama el centro de la curva cuadrática (o de la cónica) asociada a 
P. En particular, podemos concluir con el siguiente lema. 


Lema 4.6 Sea P(x) =x- Ax+k-x>+*f un polinomio cuadrático (A= A') tal que 
det(A) 4 0. Entonces si definimos e := —(1/2)A7'k, se tiene que € es el centro de 
C(P) y 

P(x+c)=x-Ax+P(c). 


EJERCICIO 4.4 Demuestra que (ABC)! =C'B'A', donde A,B, C son tres matrices 
que se pueden multiplicar. 


EJERCICIO 4.5 Encuentra los centros, si es que tienen, de las curvas asociadas a 
algunos de los polinomios siguientes: 
x2+2y?-6x+4y+3 
9x? + 24xy + 16y? — 2x — 86y + 39 
xy=-3x-=2y-2 
6 May yt 1% =26y =161 
9x2? —4xy+6y? —58x +24 y +59 
x2+2xy l y? F2x+2y=1. 


4.3.2 Rotaciones (cómo encontrar los ejes) 


Ya vimos que las traslaciones afectan la parte lineal de los polinomios cuadráticos. 
Consideremos ahora el caso en que g sea una transformación lineal g(x) = Bx (donde 
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B € G1(2)). Si P es el polinomio cuadrático general (4.3) entonces 


(Pog)(x) = P(Bx) = (Bx) - A(Bx) + k- (Bx) + f 

(Bx)' A(Bx) + k' Bx +f 

(x"B)A(Bx) + (Kk'B)x +1 
x-(B'AB)ix+(B'k)-x+f. (4.5) 


Obsérvese primero que la nueva matriz B' AB que define la parte cuadrática sigue 
siendo simétrica pues (B'AB)' =B'A' (B' y = B' AB, así que la expresión de Pog 
dada arriba es válida. Simplificar la parte cuadrática de P corresponde entonces a 
encontrar una matriz B tal que B' AB sea más simple; por ejemplo diagonal, es decir, 
con ceros fuera de la diagonal, pues entonces el polinomio P o g no tendrá término 
mixto xy. Veremos, como resultado principal de esta sección, que esto siempre se 
puede lograr. 


Hasta aquí sólo hemos usado que B es una matriz (ni siquiera usamos que fuera 
no singular, con determinante no nulo), pero si pedimos además que sea ortogonal 
entonces tenemos que B' = B”! y, en este caso, la matriz de la parte cuadrática 
se transforma en la matriz B' AB = B7!AB que tiene un significado geométrico muy 
claro. Es la matriz que expresa la función A en la base de las columnas de B. Veamos. 

Sean u y v las columnas de B, es decir B = (u,v). Six' = (x,y) entonces 
Bx = xu+yv; y podemos pensar a Bx como el vector (con coordenadas repecto a la 
base canónica) que tiene coordenadas (x, y) en la base u,v. Por 
el contrario, dado cualquier y € R?, B7!y nos da los coeficientes 
para escribir a y como combinación de la base u,v, pues es la 
solución del sistema Bx = y. Así que B7'AB es la matriz que 
describe a A, pensada como función, pero en términos de la 


base u,v; por ejemplo, (B-"AB) 10" =BA (5 (1,077) = 


B| (Au) que da, como habíamos quedado, las coordenadas de 
Au en la base u,v y los datos que le dimos, (1,0), son las 
coordenadas de u en la base u,v. Quizá este razonamiento 
general no convenza aún, pero no importa, pues en nuestro caso lo podemos concretar 
aún más. 


a 
BAB 


Supongamos, como es el caso en que estamos interesados, que B € O(2), es decir 
que BB' = I. Y sean u y v las columnas de B que forman una base ortonormal. 
Supongamos además que A actúa de manera muy sencilla en u y en v: que sim- 
plemente los alarga por factores A y u respectivamente, es decir que Au = Au y 
Av = uv. Entonces, expresar a A (como función lineal) pero en términos de la base 
B debía ser la matriz 

AO 
( q ) 
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Veamos si corresponde a B'AB: 


B'AB = (u,v)'A(u,v) = ( yT ) dis dód ( en As ) 
u.Au u-AvY|  /(u-lu u- yv 
o Qt e Au A) did 
— XL A(v:-u) u(v-v) 0 u 


Efectivamente, y con esto nos basta, pues si encontramos una matriz B que satisfaga 
y) y) 

lo anterior (que “diagonalice” la matriz A) podremos eliminar el término mixto del 

polinomio P para acercarnos a los polinomios canónicos. 


Valores propios y vectores propios 


Sea A una matriz cuadrada cualquiera. Se dice que un vector v es vector propio de 
A con valor propio A € R, si vX 0 y se tiene que Av = Av. Nuestro problema 
será encontrar parejas propias (es decir, A, v valor y vector propio correspondientes). 
A los vectores propios y valores propios también se les conoce como eigenvectores y 
eigenvalores por su nombre en alemán. 

Un vector propio de una matriz es un vector donde la matriz (por más complicada 
que ésta sea), como función, actúa de una manera muy sencilla, simplemente lo alarga. 
Nótese además que eliminamos el O de los posibles vectores propios pues éste sería, 
tal para cualquier “valor propio”; sin embargo el 0 (€ R) sí puede ser valor propio si 
la matriz anula algún vector no nulo. 

Antes de abordar el problema de encontrar vectores propios de manera algebraica, 
veamos un ejemplo sencillo donde geométricamente es fácil encontrarlos. Consider- 


emos la matriz 
2 1 
dE la ] » 


Puesto que bajo esta función el eje x gira hacia arriba y el eje y hacia 
la derecha, el cuadrante positivo se apachurra; las líneas en él cercanas al 
eje x giran en dirección contraria a las cercanas al eje y y entonces debe 
haber una línea que se queda fija. Por simetría (pasa escencialmente lo mismo en 
los dos extremos) esta línea debe ser la de enmedio; efectivamente, el (1, 1) es vector 
propio de A con valor propio 3. Los otros dos cuadrantes se abren como abanico y de 
nuevo su línea “media” se queda fija; el vector (—1, 1) es vector propio de A con valor 
propio 1. Entonces, en la base rotada 45” esta transformación consiste simplemente 
en expander por un factor 3 el primer eje y dejar fijo el ortogonal. 

Otro ejemplo geométricamente claro son las reflexiones: tienen vectores propios 
con valor propio 1 en la línea espejo y vectores propios con valor propio —1 en su 
ortogonal. 
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Veamos primero un resultado muy general que agrupa naturalmente a los vectores 
propios. 


A 


Lema 4.7 Si u y v son vectores propios de A con el mismo valor propio A € 
entonces cualquier combinación lineal no trivial de ellos también es vector propio. 


Demostración. Si Au=Au y Av= Av, entonces para cualquier par de coeficientes 
a, pb ER se tiene que 


A(au+fv) = a(Au) + BlAV) = (Au) + BlAv) =Aacu + Bv) 


y entonces, si xau + ¿v 4 0, es vector propio de A con valor propio A. Ol 


Así que los vectores propios vienen en “paquetes” que son subespacios (líneas por 
el origen es lo más común) asociados a los valores propios. Los conjuntos de vectores 
propios asociados a un valor propio se llaman espacios propios o eigenespacios; en 
ellos, la matriz actúa como una homotecia. Por ejemplo, la matriz 


2030 
0.2:0 
05.05 4 


tiene como espacio propio del valor propio 2 al plano xy y como espacio propio del 
valor propio 1 al eje z. 
Supongamos que A, v es una pareja propia de la matriz A (en particular v 4 0), 
entonces 
Av=Av 
5 Av—Av=0 
S€ (A-ADv=0. 


Esta última ecuación nos dice que la transformación (A — AI) no es biyectiva pues 
manda a un vector no cero en el cero. Y como v H% 0, esto último sucede (regresando 
formalmente al caso de dimensión 2 que sí hemos demostrado, aunque será cierto en 
general) si y sólo si 

det(A—AI) =0. 


Esto demuestra el siguiente lema. 
Lema 4.8 Para cualquier matriz A (de 2 x 2): 


A es un valor propio de A £S det(A — A) =0. 


5 


Lema 4.9 51 A es simétrica 2 x 2 entonces tiene dos valores propios A y Az en 
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Demostración. Puesto que A es simétrica, A= A", la podemos escribir 


(32) 


Consideremos ahora a A como una variable o incógnita y entonces tenemos 


det(A—AD = de (5 o 30 


der ( > a ) = (a—A)(c—A)-—b? 


= M-—(a+c)A+ (ac —b?). 


Que resulta ser un polinomio de segundo grado en la variable A. 

Este polinomio es tan importante que tiene nombre: det(A — Al) es el polinomio 
característico de la matriz A. 

Nos interesa, según el lema anterior, determinar para cuáles Á se anula este poli- 
nomio, es decir, cuáles son sus raíces. Para esto apliquemos la fórmula clásica “del 
chicharronero” (página 77), la cual expresa las raíces en términos de los coeficientes 
y en nuestro caso da: 


(a+c)+yla+c)?-4(ac—b?)  (a+c)+ ya? +2ac + c? — 4ac + 4b?) 


2 Z 
(a+c) + ya? —-2ac+c24+4b?)  (a+c)+y(a-—c)? +4b? 
¿3 A ñKñq—ÁA2— AAA AA 


Puesto que (a — c)? + 4b? > 0 por ser la suma de dos cuadrados, entonces la raíz 
cuadrada es real y det(A — AI) = 0 tiene dos soluciones reales, que vienen de tomar 
+ o — en la expresión anterior. Explícitamente, sean 


(a+c)+ y(a—c)? + 4b? (a +) (a — c)? + 4b? 
2 2 


las dos raíces; de tal manera que podemos concluir, por el Lema 4.8, que A¡ y Az son 
valores propios de A y que su polinomio característico se escribe 


det(A—AD) =(A—A)(A—A72). 


O 


Obsérvese que en la demostración fue crucial que A? = A; pues en general este 
lema no es cierto (véanse los ejercicios): no toda matriz A de 2 x 2 tiene valores 
propios, como no todo polinomio cuadrático en una variable tiene raíces reales. 

Además, de la demostración podemos concluir (para matrices simétricas) que los 
dos valores propios coinciden si y solamente si a = Cc y b= 0 (pues se debe tener que 
(a — c)? + 4b? = 0); es decir, los dos valores propios coinciden si y sólo si la matriz 
original es la de una homotecia. Tenemos entonces: 
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Corolario 4.10 Sea A simétrica 2x2 y sean M,A2 sus dos valores propios. Entonces, 
sus valores propios coinciden (M = M4) si y sólo si A=M 1. Y en este caso, cualquier 
vector v 4 0 es vector propio. O 


Corolario 4.11 Sea A simétrica 2 x 2. Entonces existe una base u,v de R? donde 
u y v son vectores propios de A. 


Demostración. Por el Lema 4.9 sabemos que A tiene dos valores propios, A y Az. 
Si éstos fueran iguales, por el corolario anterior cualquier base funciona. Si fueran 
diferentes (A; 4 A2), entonces por la definición de valor propio existen vectores propios 
u,v distintos de O correspondientes a los valores propios A¡ y Az respectivamente. 
Estos dos vectores no pueden ser paralelos pues por el Lema 4.8 sus valores propios 
coincidirían. Entonces forman una base de R?. O 


Un ejemplo Vale la pena hacer un ejemplo concreto para fijar ideas. Consideremos 


la matriz simétrica 
2D 
aan) 


Para encontrar sus valores propios hay que resolver su polinomio característico 


que es 
22 A 
e((24)-L03) 
2 
des ( 2 EN) 
= (2-M(-1-M-4 
= M-A-6. 


det(A — Al) 


La fórmula nos dice que sus raíces son 
Mm=(1+v1+24)/2=3 y A =(1-5)/2= 2, 


lo cual implica que 
det(A — AI) = (A — 3)(A +2). 


Aunque en este caso pudo haber sido resuelto sin usar la fórmula, ya tenemos los 
dos valores propios. Para encontrar los vectores propios correspondientes, habrá que 
encontrar una solución no trivial de los sistemas (A—A¡D)x = 0. Para A; = 3 tenemos 


2 Xx ZU ON», 
am) (1) ) Lo): 
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y una de sus (múltiples) soluciones no triviales es u* := (2, 1). Compruébese directa- 
mente que Au = 3u como reza la teoría. Para el otro eigenvalor, Az = —2, el sistema 


es 
(42 ARENA 
a) 9) 0) 


y una solución no trivial es v' = (—1,2). 
No sólo obtuvimos que los vectores propios u y v forman una base de I¡R?, sino 
mucho más: que son ortogonales. Pero esto, como veremos, no es coincidencia. 


EJERCICIO 4.6 Demuestra que la matriz ( ; E 


) no tiene vectores propios. Da 
un argumento algebraico y uno geométrico. 

a —b , Ñ 
EJERCICIO 4.7 Demuestra que la matriz ( . a ) no tiene vectores propios para 


b 40. ¿Puedes dar un argumento geométrico? 


Conclusión (diagonalización ortogonal de matrices simétricas) 


En nuestro estudio de los vectores propios de las matrices simétricas, saquémosle 
jugo ahora a lo que ya sabíamos sobre su buen comportamiento respecto al producto 
interior. 


Lema 4.12 Sea A una matriz simétrica. S1 A, u y A,,v son pares propios tales que 
M A», entonces u y v son ortogonales. 


Demostración. Usando el Lema 4.5, tenemos 
Aj (u-.v)= (Au) .v=Au.v=u:Av=u:-(A%v) =2(u - v), 


de donde 
ON == A)(u . v) =0. 


Si A; H% A, esto implica que u - v=0. O 
Podemos entonces concluir. 


Teorema 4.13 Sea A una matriz simétrica 2 x 2. Existe una rotación B € O(2) tal 
que B'AB es diagonal, es decir, tal que 


O, 
prap=( 20 


donde A y Az son los valores propios de A. 


194 CAPÍTULO 4. CÓNICAS 1I (CLASIFICACIÓN) 


Demostración. Por el Lema 4.9, A tiene valores propios A¡,42 € R. Si Ay = A 
entonces A ya es diagonal por el Corolario 4.10, y B puede tomarse entonces como la 
identidad. Si A; % Az, sean u y v vectores propios respectivos. Por el Lema 4.12, u 
y v son ortogonales, entonces v es paralelo a u+; y por el Lema 4.7, u* también es 
vector propio correspondiente a A. Sea 


1 
B=— (uu); 
ru] (17) 
puesto que u % O, claramente B es la matriz de una rotación. Y con un cálculo 
análogo al que hicimos en (4.6) se concluye el teorema. Ol 


La teoría que hemos desarrollado se resume en una receta muy simple. 


Receta para diagonalizar matrices simétricas. El ingrediente es una matriz 
simétrica A=A' de 2 x 2. 

El primer paso consiste en resolver su polinomio característico det(A — Al). 

Una vez que se conocen A¡,42 € R tales que det(A — AI) = (A— A¡)J(A— 27), 
procédase a encontrar u 4 0 tal que (A — A Du = 0 (esto le resultará muy fácil si 
recuerda las propiedades del compadre ortogonal, pues basta aplicarlo a un renglón 
de (A == AM D). 

Y todo ya está cocinado para declarar B = (1/[ul)(u, u+). El resultado será que 
B'AB es la matriz diagonal con entradas A; y 2». 


EJERCICIO 4.8 Concluye la demostración del Teorema 4.13. 
EJERCICIO 4.9 Encuentra la matriz B de una rotación que diagonalize las siguientes 


matrices simétricas: 
1 1 o 1 =6 12 
1 1 10 12 1 
9 — —7 —< 9 12 
2 6 6 2 12 16 )' 
Calcula B' AB, donde A es una de las anteriores y B la rotación correspondiente. 
EJERCICIO 4.10 Demuestra que si una matriz A (no necesariamente simétrica) tiene 
dos valores propios distintos entonces existe una matriz B € G1(2) tal que B!AB es 
diagonal. 


4.4 Clasificación de curvas cuadráticas 


Hemos estudiado cómo afectan las traslaciones y las transformaciones ortogonales a los 
polinomios cuadráticos; ahora juntaremos nuestros resultados para dar su clasificación 
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isométrica. Pero empecemos con un ejemplo concreto para fijar las ideas, técnicas y 
resultados que obtuvimos en la sección anterior. 


4.4.1 Ejemplo 


Consideremos el polinomio cuadrático 


P (xy) =8x2+12xy+ 174? —16x-—12y-—12; 


queremos saber qué curva define y dónde está. Para pasarlo a su forma vectorial, 
P(x) =x- Ax + k-x-+*f, definimos f = —12, 


8 6 —16 
A=( 6 $) y k= (75): 
El determinante de A es det (A) =8x 17—6x6= 100 distinto de cero, y por tanto 
C (P) tiene centro 


a (MA ( 17-61 (8Y_ 1 (8x17-6x6Y_(1 
e 2) 70-656 8 Jl6)71001-8x6+6x8) 10) 
De tal manera que si trasladamos la curva C (P) por el vector (—1,0) ésta queda 
definida por el polinomio 


Pi (x) =P(x+c)=x-Ax+P(c) =x - Ax — 20. 


Ahora queremos encontrar una rotación B que elimine el término mixto de P;, y 
para esto, seguimos la receta de diagonalización. El polinomio caracteristico de A es 


8=A 6 


det (A —M) = der ( A 


) = M-—254+100 =(A—5)(A—20) 
y entonces sus valores propios son Aj = 5 y Az = 20. Para el primero de ellos, se tiene 


que 
3 6 
Ro) 


y podemos tomar como solución del sistema homogéneo que define a u! = (2,—1), 
de tal manera que una rotación que diagonaliza a A es 


MA A E 
B= (4 3 srap= (7 do 
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Podemos concluir, por (4.5), que si rotamos el eje x a la línea con dirección (2, —1) 
el polinomio Py toma la forma 


Pa (x) =P, (Bx) = 5x? + 20y? — 20 


que, finalmente, es equivalente a 


1 
Pol) = ¿e (x) =x?+4y?-4. 
A La curva cuadrática de P¿ es claramente una elipse dada por 


la ecuación canónica 
x? 3 
4 


Entonces podemos concluir que C(P), la que originalmente que- 
ríamos describir, es una elipse con centro en (1,0), eje mayor 
de tamaño 2 en la dirección del vector (2, —1) y eje menor 1. 

Ya que tenemos los numeritos calculados y frescos, prosigamos con el ejemplo 
hasta su final afín. Si al círculo unitario lo expandemos en el eje x un factor 2, y luego 
componemos con la isometría Bx +, debemos llegar justo a C (P). La transformación 
afín que acabamos de describir tiene la fórmula 


4 1 
(03600) 
Puesto que dividimos entre 5 y luego entre 4 para obtener la ecuación canónica de la 

elipse, debe ser cierto, según la teoría que hemos desarrollado, que 


(Po g) (x,y) = 20 (x? + y?—1). 


EJERCICIO 4.11  Ensuciate las manos y haz con cuidado todo el trabajo (“talacha” 
le llamamos en México) que compruebe nuestra última aseveración; simplemente hay que 
sustituir fórmulas, expandir y simplificar. O bien, prográmalo y revísalo en algún paquete 
matemático adecuado. 


4.4.2 Clasificación isométrica 


Consideremos de nuevo el polinomio cuadrático general 


P(x) =x-Ax+2b-.x+c, 
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con A=A' 4 0; donde el vector constante b que determina la parte lineal es ahora 
la mitad del que habíamos tomado antes (K) para evitar el D que nos aparecía; nótese 
también que hemos cambiado el nombre a la constante. Y sea 


g(x) =Bx+h 


una isometría, es decir, B € O (2). Al hacer los cálculos como en las secciones 
precedentes, se obtiene que 


(Pog)(x) = x-(B'AB)x+2 (Ah +b)- (Bx) +P (h) 
= x-(B'AB)x+2B'(Ah+b)-x+P(h). (4.7) 


Debemos partir nuestro análisis en dos grandes casos de acuerdo con el determi- 
nante de la matriz A. 
Caso 1: det (A) 4 0. 


Si escogemos a h como el centro (h = —A7!b) y a B como una rotación que diago- 
nalice A (bien definida salvo el orden y orientación que demos a los vectores propios), 
entonces P es isométricamente equivalente a un polinomio de la forma 


Pr (xy) =ax?+Buy?+y, (4.8) 


donde a y (3 son los valores propios de A y y es el valor del polinomio original evaluado 
en el centro (nótese que con estos datos bastan). 

Ahora bien, tenemos también que a y (3 son distintos de cero por el siguiente lema 
que habíamos postergado. 


Lema 4.14 Si A es una matriz simétrica con valores propios « y 3, entonces 
det (A) = af 


Demostración. Por el Teorema de diagonalización, 4.13, sea B una rotación que 
diagonaliza a A. Entonces como el determinante es multiplicativo se tiene que 


ap = des ES A ) = det (B"AB) 
= det (B”) det (A) det (B) =1 x det (A) x 1 
= det (A). 


O 


Entonces tenemos naturalmente dos subcasos: cuando det (A) > 0 y los signos de 
a y $ coinciden, o bien cuando son distintos y det (A) < 0. 
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det (A) > 0: Tenemos tres posibilidades. Primera, si la costante y es cero (el 
centro es parte de la “curva” C (P)) entonces la única solución (el único cero de (4.8)) 
es (x,y) = (0,0), pues de otra forma es estrictamente del signo de los eigenvalores. 
Segunda, si la constante y es del mismo signo que ax y f, entonces la curva es vacia pues 
no hay soluciones (reales, insistamos, pues se le puede llamar “elipse imaginaria”). Y 
por último, si el signo de y es el opuesto a los de x y f3, los ceros de P¡ (véase (4.8)) 


claramente coinciden con las soluciones de la ecuación canónica de la elipse: 
2 a y? 
A 


donde a = y —y/a y b= y/—y/f. 
det (A) < 0: Sólo tenemos dos posibilidades. Si y = 0, P, es una diferencia de 
cuadrados que se puede factorizar en la forma 


y) 


(ax+buy)(ax-— by) 


donde hemos supuesto que ax > 0 (y entonces a = ya y b = y—B), cuya curva 
consiste en dos rectas cuya intersección es el centro. O bien, si y 4 0 podemos 
escoger el primer vector propio (correspondiente a la variable x) de tal manera que 
su valor propio x tenga signo contrario a y, y entonces los ceros de P¡ corresponden 
a las soluciones de la ecuación canónica de la hipérbola: 


donde a = y/—y/a y b= y/y/f. 


Caso 2: det (A) =0. 


Puesto que no tenemos la seguridad de eliminar la parte lineal, nos conviene simplificar 
primero la parte cuadrática (cuidado en los ejercicios, esto modifica la parte lineal). 
En este caso, por el Lema 4.14, uno de los valores propios es cero, y el otro es distinto 
de cero pues, si no, por el Corolario 4.10, la matriz A sería la matriz nula que hemos 
desechado desde el principio. Entonces, podemos diagonalizar (rotar) para que el 
valor propio correspondiente a x sea el no nulo, y dividiendo entre él obtener que P 
es isométricamente equivalente a un polinomio de la forma 


x2+2ax+By+y. 
Este polinomio siempre se puede reescribir como 
+07 +Bu+(y-a?), 


de tal manera que haciendo el cambio de variable isométrico x' =x+ a, y olvidando 
la prima, se simplifica a 


Po(xy) =x?+ay+b. (4.9) 
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donde a y b tienen las definiciones obvias. ¿A precomponer con qué traslación cor- 
responde este cambio de variable? Y de nuevo tenemos dos subcasos. 


a =0: Si b < 0 entonces el polinomio (4.9) define (y por tanto C (P) consiste de) 
dos rectas paralelas. Si b = 0, es una recta doble; y si b > 0 consiste de “dos rectas 
imaginarias” (en R? es el conjunto vacío). 


a 40: Con una traslación en el eje y, o equivalentemente, el cambio de variable 
y! =y + b/a y olvidando la prima, obtenemos que P es isométricamente equivalente 
al polinomio 


x2+ay, 


que define una parábola. 


En resumen, hemos demostrado que cualquier polinomio cuadrático es isométrica- 
mente equivalente a alguna de nueve posibles familias canónicas. Enfatizamos lo de 
familias, pues nótese que (con isometrías) no podemos deshacernos de ciertos paráme- 
tros. Por ejemplo, y para describir los casos importantes, en las elipses nos quedaron 
los parámetros a y b en la ecuación canónica, que podemos suponer positivos (pues 
como se usan sus cuadrados el signo da lo mismo) y además podemos suponer que 
a > b (pues al rotar 90? se intercambian las variables x y y en la ecuación). De tal 
manera que, como intuitivamente ya sabíamos, hay una clase isométrica de elipses 
para cada pareja a > b > 0 (los semiejes major y menor); los casos extremos 
a = b > O corresponden a los círculos. En las hipérbolas, no podemos intercam- 
biar las variables (cuyo papel se define respecto a la constante) y tenemos una clase 
para cada par a,b estrictamente positivo. Por último, las parábolas dependen del 
parametro a > 0 (pues cambiar y por —y es una isometría). 
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EJERCICIO 4.12 Describe geométricamente algunas de las curvas cuadráticas definidas 
por los polinomios siguientes (da el centro, la dirección de los ejes y los parámetros o la 
ecuación canónica correspondiente). Escoge al menos una elipse, una hipérbola y una 
parábola. 
66 Mi y? =12%=26y =161 
9x2? —4xy+6y? —58x + 24y +59 
x2+2xy+y?+2x+2y=1 
AE 184 252% = 129 4247 
5x2 + 24xy — 54? + 14x — 34y — 37 
66x? — 24xy +59y? — 108x — 9%4y +1 
13x? + 10xy + 13y? +42x-—6y —27 
9x2 +6xy+17y? +12x-—28y — 52 
7x2 —12xy +24? +40x+20y —55 
9x?—24xy+16y? + 130x—90y + 175 
18x? +48xy + 32y? —29x+3y — 22 
rta 380988 
—7x2 +48xy +7y? + 158x — 6y — 88 
—24x? — 14xy + 24 y? + 152x — 164 y + 151 
7x2 +48xy —7y? +116x — 138 y — 348. 


EJERCICIO 4.13 Encuentra un polinomio que defina las siguientes curvas cuadráticas. 
a) La elipse con semieje mayor 3 en la dirección (3,4), semieje menor 2 y centro en (—1, 2). 
b) La hiperbóla con semieje principal 4 en la dirección (2, 1), semieje secundario 1 y centro 
en (2,3). 

c) La parábola con vértice en (1,3) directriz en la dirección (1,4) y distancia focal 1. 


4.4.3 Clasificación afín y por semejanzas 


Para concluir con la clasificación afín que habíamos anunciado al principio de la 
Sección 4.2, bastará convertir los parámetros que nos quedan (x, $ y y, o bien a y 
b, en los párrafos anteriores) en 10 —1. Y es claro que esto debe lograrse alargando 
(o encogiendo) adecuadamente en los ejes, y saliéndonos entonces del ámbito de las 
isometrías. Por ejemplo, en el polinomio de la parábola, P (x,y) = x?+ay con a 40, 
se obtiene que 


es 
a 
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que equivale a precomponer con la expansión de —a”? en el eje y, y que nos da justo el 
polinomio de la parábola canónica, (111) en la Sección 2.1. Éste es el único polinomio 
con parte lineal de la clasificación isométrica, así que podemos olvidarnos de estos 
términos. 

Si en P¡ (4.8) o en Pz con a = 0, hay un término constante no nulo podemos 
dividir entre él para hacerlo 1. Y nos queda entonces preocuparnos por los términos 
cuadráticos puros como ax?. Obsérvese que, si en vez de x, sustituimos la expresión 
ax (una nueva a, cualquier a + 0), se obtiene a (ax)? = (a a?) x* de tal manera que 
el coeficiente puede cambiar, pero nunca cambiará de signo. En términos de matrices, 
si precomponemos a Pz (4.9) con una transformación lineal que expanda el eje x por 
un factor a y el eje y por b, la matriz de la parte cuadrática resultante será: 


a ea 0 a 0 A O A ai A 
aro) (sp) loo) Lo vs): 


E] 1 
Así que lo que debemos hacer es tomar a = ( a) b= ( Bl) para obtener 


sel: 8 
(CA a UN 


Con estas observaciones, es fácil ver que los subcasos de la clasificación isométrica 
dada en la sección anterior corresponden a los incisos y polinomios de la Sección 2.1, 
con lo que se completa el teorema de clasificación afín. 

Si consideramos por último el grupo de semejanzas, entre las isometrías y las afines, 
en la matriz “B” última que usamos se debe tener que a = b. Entonces sólo podemos 
lograr que uno de los coeficientes se haga +1, y por tanto las elipses (imaginarias o 
no) y las hipérbolas módulo semejanzas tienen un parámetro que puede ser la razón 
entre los semiejes o, como habíamos visto en el Capítulo 2, la excentricidad. 


una matriz del tipo 


EJERCICIO 4.14 ¿Cuál es la matriz de una homotecia que lleve a la parábola dada 
por x? + ay, con a % 0, en la canónica (dada por x? —y)? Concluye que hay sólo una clase 
de parábolas módulo semejanzas. 


4.5 *Lo que no demostramos 


Aunque sí demostramos (detalles más, detalles menos) que cualquier polinomio cua- 
drático es afinmente equivalente a alguno de los nueve canónicos, no demostramos 
que estos no son equivalentes entre sí. Es decir, que son justo nueve las clases de 
equivalencia. Un argumento de tipo topológico va como sigue. 

Si un polinomio de una elipse fuera equivalente a uno de una hipérbola, en- 
tonces tenemos una transformación afín, afinidad debíamos llamarla para resumir, 
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que manda a la elipse en la hipérbola. Pero esto no es posible porque la hipér- 
bola parte el plano en tres pedazos (que se llaman las “componentes conexas” de 
su complemento) y la elipse sólo en dos. Para diferenciar a la elipse de la parábola 
necesitamos usar otra cualidad; la de acotado funciona, pues la elipse lo es mientras 
que la parábola no. En el fondo estamos usando que las afinidades son continuas y 
que bajo transformaciones continuas estas propiedades se preservan. Para diferenciar 
a las degeneradas no vacías entre sí, este tipo de argumentos funcionan; y para difer- 
enciarlas con las no degeneradas habrá que usar que estas últimas no contienen rectas 
y son más que un punto. Sin embargo, con estos argumentos topológicos no podemos 
diferenciar a los dos polinomios de las curvas vacías, aunque a estos sí de los demás. 


Otra cosa que no demostramos es que los polinomios que definen a una misma 
cónica son únicos salvo constantes diferentes de cero. Como veremos, esto tiene que 
ver con su grupo de simetrías afines. Consideremos el caso más simple; el del círculo 
unitario S! cuya matriz asociada es la identidad, pues está definido por el polinomio 


P(x) =x-x-1=x-Ix-— 1. 


Supongamos que otro polinomio cuadrático P¡ también define el círculo unitario, 
es decir, que S! = C.(P¡). Queremos demostrar que entonces existe k 4 0 tal que 
P,¡ =kP. Por el Teorema de Clasificación Afín y el párrafo precedente sabemos que 
P; y P tienen que ser afinmente equivalentes. Entonces existen g € Af(2) yk X% 0 
tales que 


P; =k(P og). 


Esto implica que g manda biyectivamente a S' en S! (arguméntalo). Es decir, que 
g es una simetría afín del círculo unitario. Ejemplos de este tipo de las g son las 
transformaciones ortogonales, y ahora demostraremos con argumentos geométricos 
que son las únicas. 


Para ver que g deja fijo el origen (y que entonces es lineal) hay que determi- 
narlo, como centro del círculo, en términos geométricos: es el punto medio del 
segmento que une los puntos de contacto de dos tangentes paralelas. Las tan- 
gentes son rectas que intersectan el círculo en un único punto; como g manda 
líneas en líneas, manda entonces tangentes en tangentes. Como además g 

preserva paralelismo y puntos medios, tiene que dejar fijo el centro y por tanto es 
lineal. 
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Sea u = g(e1) € S!; nos falta demostrar que g (e2) = 
+u”. La tangente a S! en es, €; digamos, es la vertical 0 
por e, que bajo g tiene que ir a la tangente en u, que es 
la ortogonal al vector u por el punto u. Entonces, el eje y 
(paralelo a €, por el centro) va bajo g a la ortogonal a u 
por el origen, sea ésta l,. Como e, €S' N (eje y), entonces 
g (ez) eS nf, = fu”, —u* ), y por lo tanto g es ortogonal 
y se escribe como g (x) = Bx con B € O (2). Tenemos entonces la siguiente igualdad 
de polinomios 


Py (x) k(P o g) (x) = k (P (Bx)) 


k (x- (B'IB)x-1) =k(x-Ix—-1) =kP(x), 


pues B'B = I, que es lo que queríamos demostrar: los polinomios cuadráticos que 
definen el círculo unitario, S', son exactamente los de la forma 


k («4 +y?*-1) con kX0. 


Con este caso concreto en la mano, es fácil argumentar que para cualquier elipse 
los polinomios que la definen difieren por constantes distintas de cero. Pero en general, 
esta línea de argumentación deja mucho que desear. Habría que argumentar geométri- 
camente en cada caso (llevamos uno de nueve) y obtener el grupo de simetrías afines 
de una cónica (véase el ejercicio sobre simetrías de la hipérbola). Algo que resulta 
imposible para las cónicas vacías, de las que tenemos dos, la degenerada y la no 
degenerada, que no podemos diferenciar geométricamente. 


La línea de argumentación clásica va por otro lado; es algebraica. Pero depende 
de cerrar algebraicamente a los números reales en los complejos, y ahí sí funciona. 
Si dos polinomios tienen los mismos ceros, entonces, salvo constantes, son potencias 
de un mismo polinomio, y esto podría considerarse como el principio de la geometría 
algebraica moderna. Rebasa el contexto de este libro. 


EJERCICIO 4.15 Demuestra que el conjunto de afinidades que dejan invariante un 
polinomio cuadrático P, 


Simar (P):=[g € Af (2)|Pog =P), 


es un grupo. 


EJERCICIO 4.16 Para P(x) =x-x-— 1 demuestra algebraicamente que 


Simar (P) =0 (2). 
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EJERCICIO 4.17 Sea H la hipérbola canónica dada por la ecuación x? — y? = 1. 
Demuestra que para cualquier (a, b) € H se tiene que la transformación lineal definida por 


la matriz 
a b 
b a 


deja invariante a (es una simetría afín de) H. 


*EJERCICIO 4.18 Demuestra que si g € Af (2) es tal que g (H) = H (con H la hipérbola 
canónica) entonces g es lineal y está dada por una matriz como la anterior, o bien por esa 
seguida de la reflexión en el eje x. 

“EJERCICIO 4.19 Demuestra que dos polinomios que definen la hipérbola canónica 
difieren por una constante (Py = kP,). 


Capítulo 5 


La esfera y el espacio 


En este capítulo estudiaremos la geometría de la esfera. Veremos cómo hay, y se 
puede hacer, geometría en otros “espacios” además del plano euclidiano. Pero antes 
tenemos que repasar y ver ciertas propiedades de su “hábitat” natural, del espacio 
ambiente en el que vive. 


5.1 Planos y líneas en ¡R* 


Hemos visto que un plano en IR* se puede definir, al menos, de tres maneras. La 
primera, una descripción paramétrica, dando un punto base p y dos vectores direc- 
cionales no paralelos u y v, para describir un plano 
TT con dos parámetros libres s y t como 


M=(p+su+tvl|sjteR). 


La segunda, una descripción baricéntrica, dando tres 
puntos no colineales a, b, c en él, y se le describe por 
coordenadas baricéntricas (o combinaciones afines): 

T=[(aXa+pb+ycla,Bp, yeR;¡a+p+y=1). 


Y finalmente, una descripción intrínseca por medio de una ecuación normal: se dan 
un vector normal n 4 0 y una constante d € RR tales que 


TT: n-x=d. 


Pasar de una descripción baricéntrica a una paramétrica, y viceversa, es fácil 
pues tomando Aa =p,b =p +u y € = p + y por ejemplo, podemos transformar 
una en la otra (Sección 1.4.2). El primer problema importante que vamos a atacar 
es cómo encontrar una ecuación normal para un plano dado paramétricamente. Es 
decir, dados u y v, no paralelos, encontrar un vector n perpendicular a ambos. Pero 
antes, veámos con un ejemplo cómo es fácil encontrar una descripción paramétrica, O 
baricéntrica, de un plano dado por una ecuación normal. 
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Tomemos por ejemplo la ecuación 
2x+y=z=2, 


que define un plano TT normal al vector (2,1,—1). Para encontrar una descripción 
baricéntrica basta encontrar tres soluciones particulares no colineales. Y para esto, 
podemos asignar valores arbitrarios a dos de las variables y despejar la tercera. Lo 
más fácil es hacerlas cero. Así, si hacemos y = 0 y z = 0 la ecuación implica que 
x= 1 y por tanto que a = (1,0,0) es una solución. Análogamente, b = (0,2,0) y 
c = (0,0, —2) son soluciones. Y estos tres puntos nos dan una descripción baricéntrica 
del mismo plano pues son los puntos de intersección de TT con los tres ejes, y en este 
caso no son colineales. 

Para obtener una descripción paramétrica, podemos tomar a A como punto base 
yab-—ayce-— a como vectores direccionales: 


1 =1 —] 


NÓ 0 |+s 2 +t 0 |s, TER 
0 0 —2 
l=s—t 
= 2s Is tER 
—2t 


Y efectivamente, estos valores siempre satisfacen la ecuación original; para corrobo- 
rarlo, podemos sustituir en la ecuación original y ver que simbólicamente, es decir, 
independientemente de los valores de los parámetros, siempre se cumple que: 


2(1—s—t) + (25) - (-2t) =2. 


Hay que observar que a veces puede ser un poco, pero no mucho, más difícil encontrar 
soluciones particulares no colineales (veánse los siguientes ejercicios). 

Por último, es bonito ver lo fácil que resulta demostrar por qué el método que 
acabamos de esbozar funciona siempre. 


Lema 5.1 Si a,b, e son soluciones de la ecuación lineal n-x = d, entonces cualquier 
combinación afín de ellos también lo es. 


Demostración. Recordemos que una combinación afín de a,b, c es un vector que 
se expresa de la forma 


xa+pb+ye con a+Fb+y=!l. 
De la linearidad del producto interior, la hipótesis y esta última ecuación se obtiene: 
n-(aa+pb+yc) = a(n-a+f (n-b)+ y (n-.c) 
ad+Bd+yd 
(a+ B+y) d=d. 
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EJERCICIO 5.1 Encuentra descripciones baricéntricas y paramétricas para los siguien- 
tes planos: li :2x-—3y+Z=6; l:x+4y-2z=4; M3:-—x+y=2z=2; Ta: 
5x—2y+z=1. 

EJERCICIO 5.2 —Enuncia y demuestra el lema anterior para combinaciones afines de 
longitud arbitraria (no necesariamente de tres vectores) y en cualquier espacio vectorial. 


5.1.1 El producto cruz 


Consideremos ahora el problema inverso: encontrar una ecuación normal para un 
plano descrito con parámetros. Puesto que sabemos pasar de una descripción bar- 
icéntrica a una paramétrica y viceversa, el problema se reduce a encontrar un vector 
perpendicular a dos vectores Uu y v dados. Es decir, tenemos que resolver el sistema 


u-x=0 
YV+-X=0, u 


o bien encontrar un punto x en la intersección de los planos 
ortogonales a u y a v. Puesto que el sistema es homogéneo (las 
constantes son cero), siempre existe la solución trivial x = 0; 
pero ésa no nos sirve pues el vector normal a un plano debe ser 
distinto de cero. De tal manera que si encontramos n % O que 
satisfaga las dos ecuaciones anteriores, entonces el plano que 
pasa por p con vectores direccionales u y v tendrá la ecuación 
normal 


n-x=n-p. 


Además, resolvamos de una buena vez el problema de manera general, tratando de 
no hacer suposiciones adicionales sobre los vectores dados. 

Asignemos coordenadas a nuestros vectores usando subíndices, u = (u;, uz, uz) y 
v = (v;,v,,v3), para que el sistema se escriba 


Uy Xx +F UY + Uz=0 
vWX+vuy+vz=0 


con x = (x,y,z) como nuestro vector variable o incógnita. Para eliminar una de 
las variables, podemos usar el mismo método que en sistemas de 2 x 2. Eliminemos 
z multiplicando la segunda ecuación por uz, la primera por —v3 y sumando para 
obtener 


(uzv; — v3u) x + (uzv2 — v3u2z) y =0. 
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Esta ecuación ya la conocemos aunque las constantes tienen otros nombres (re- 
cuérdese nuestro primer encuentro con el compadre ortogonal). Tiene una solución 
canónica “volteando” los coeficientes y en uno de ellos también el signo, es decir: 


Xx = UV — V2Uz ; Y = UzV] — Vu. 
Al sustituir ahora estos valores en la primera ecuación y simplificar se obtiene 


u (uzv3z — v2u3) + u (uzv; —v3u) +uzz = 0 
uz (uv —v3u1 +2) = 0, 


que, independientemente del valor de uz, tiene la solución 


Z= UV, — Vu). 


La solución particular que acabamos de encontrar (y que siempre funciona pues 
nunca dividimos ni hicimos ninguna suposición sobre si los coeficientes son cero o no) 
es tan importante que tiene nombre establecido. Se llama el producto cruz de u y v. 
Y para resumir, remarcar y establecer su notación, definámoslo como el vector 


u v1 uvV3 — V2Uz 
uxv= u Xx Va “== UzV] — Vu; . (5.1) 
uz Va Uv — v1U2 


La fórmula parece complicada, pero la “cantaleta” que nos ayuda a recordarla la hace 
sencilla. Obsérvese que en la primera coordenada del producto cruz no aparecen las 
primeras coordenadas de los ingredientes: es justo el determinante de la matriz 2 x 2 
que se obtiene al eliminar el primer renglón de la matriz 3 x 2 de los dos vectores. 
La segunda coordenada es de nuevo el determinante al eliminar ahora el segundo 
renglón, pero con signo negativo. Y la tercera vuelve a ser el determinante tal cual 
al olvidarse del tercer renglón. El producto cruz se arma de subdeterminantes 2 x 2 
ignorando datos (coordenadas) correspondientes y teniendo cuidado en los signos (el 
de enmedio lleva un signo “menos”). 


Geométricamente, el producto cruz es a R? lo que el compadre ortogonal es a R?. 
En el plano, dado un vector u, se puede escoger un vector canónico ortogonal a él 
girándolo 90” en la orientación positiva; ése es su compadre ortogonal u* que tanto 
nos ha ayudado; nótese que u* está en la media recta de vectores ortogonales a u 
que está a “su izquierda” y que tiene la magnitud de u. 
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En R* no es posible escoger de manera coherente un ortogonal para un vector 
variable u, pues u tiene todo un plano de ortogonales y es imposible decidir cuál de 
ellos es “el bueno”. Pero para dos vectores, U y v, sí se puede elegir al “bueno” de 
manera geométrica: si generan un plano, tenemos que escoger un vector en su recta 
ortogonal. Primero escogemos el lado de ese plano donde el giro de u a v se ve en 
sentido contrario a las manesillas del reloj (positivo). Ello nos da 
media recta de sus posibles ortogonales. Y de estos, escogemos el. UxV 
que tiene magnitud igual al área del paralelogramo que generan u 
y v. Así obtenemos un ortogonal a ellos, escogido canónicamente, 
y que es precisamente su producto cruz, u x v, como veremos más 
adelante. Obsérvese además que la construcción geométrica del 
producto cruz que acabamos de esbozar funciona también cuando u y v no generan 
un plano, pues entonces están en una línea que pasa por el origen, el área de su 
paralelogramo es cero y les toca entonces el vector 0. Así que el producto cruz 
también debe detectar si u y v son linealmente dependientes. 

Hemos hecho muchas afirmaciones que ahora debemos demostrar. Empecemos por 
las propiedades elementales del producto cruz con respecto a las otras operaciones que 
ya Conocemos. 


Teorema 5.2 Sean u,v,w E R* tres vectores cualesquiera y t € IR. Se cumplen 
entonces las siguientes propiedades del producto cruz: 


i) (uxv).u=(uxv).v=0 

di) Uxv=-—vxu 

im) ux (v+w) = (u xv) + (u x w) 
iv) ux (tv) =t (u x v) 

v) (uxv).w=u-(vxw) 

vi) (uxv)xw=(u-w) v—(v.w) u 
vii) |u xv] = Jul |v| sen 6, 


donde O (entre 0 y TT) es el ángulo entre u y v. 


Demostración. La propiedad (i) es justo la motivación que usamos para definir 
el producto cruz (que es ortogonal a u y a v). La propiedad (ii) se conoce como 
antisimetría: las variables no conmutan sino que anticonmutan. Las propiedades (111) 
y (iv) son la linearidad del producto cruz, que junto con (ii) dan que también es 
lineal en la primera variable; se dice que es bilineal. Todas ellas se siguen directamente 
de la definición dada en (5.1) y se las dejamos como ejercicio al lector. 

El inciso (v) es igualmente fácil pero es tan importante que preferimos darle un 
pequeño espacio. Al desarrolar ambos lados (según las definiciones de los productos 
cruz e interior, y usando la notación que más conviene, que es la de subíndices para 
las coordenadas: u = (u¡,u2,u3), v= (v¡,v2,v3) y w = (w;, wz, w3)) se obtiene una 
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suma de monomios de la forma +u¡v;wx con (1,5, k) =[1,2,3). A saber, siguiendo el 
orden de u - (vx w) y la correspondiente fórmula (5.1) para (v x w), tenemos 


uy (v2w3 — v3w2) + u) [v3w; — v¡w3) + uz (v¡w, — v2w1) 
= UV2W + U2V3W] + UzV¡W) — (U¡V3W) + U2V¡W3 + UzV7W1), 


que son todas las posibles permutaciones de los tres índices. Nótese que las que 
tienen signo positivo son las tres que preservan el orden cíclico 1>2>=3= 1 y 
las que tienen menos son las tres que lo invierten. Para concluir (v) basta ver que 
al desarrollar (u x v) - w se obtienen de nuevo los seis posibles monomios y con los 
mismos signos, aunque en diferente orden. Esta función que asocia a tres vectores un 
“numerito” es el determinante y la estudiaremos con detalle más adelante. 

La razón geométrica de (vi) es que cualquier vector ortogonal a (u x v) está 
contenido en el plano que generan u y v, y por tanto se expresa en términos de ellos. 
Pero que los coeficientes sean tan nítidos es agradable. Para demostrarlo hay que 
desarrollar 


uV3 — Vv2Uz wW] 
(uxv)xw= | uzv — vu; x | w 
uv, — vu) w3 


Hagamos con cuidado la primera coordenada; las otras dos son análogas y se dejan al 
lector o bien se siguen de la simetría en el uso de los subíndices. Al aplicar de nuevo 
la fórmula del producto cruz se tiene que la primera coordenada es 


u3V] — V3u1) w3 — (uv) — v¡u2) w> 
UzW3 + U2W)) v; — (v3W3 + v2w)) uy 


( 
( 
(uw; + u2w + sa v] — [V¡W] + V2W) + v3w3) uy 
(u-w) v, — (vw) uz, 

que claramente es la primera coordenada de (u - w) v— (v- w) u, y entonces 


(uxv)xw=(u-.w) v— (v-.w) u 


Probemos, antes de entrarle a (vii), que de aquí se sigue que el producto cruz 
no es asociativo (más que un “producto algebraico” es un “producto geométrico”). 
Usando la antisimetría, (11), y la fórmula para un doble producto, (vi), se obtiene 


uxí[(vxw) = —(vxw)xu 
— ((v-u) w-— (w-u) v) 
= (u-w) v— (u-v) w, 


que no tiene por qué ser igual a (u x v) x w. Geométricamente, este último está en 
el plano (u, v) y el que desarrollamos en el (v, w). 
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Y para demostrar (vii) desarrollemos [u x v!? usando, respectivamente, (v) y (vi) 
en las dos primeras igualdades: 


fu xv) - (u x v) u-(vx (u x v)) 


= u-((v.v) u— (v-u) v) 
(vv) (uu) — (u - v)? 
= |vi? jul — Jul? lvl? cos? 8 
ul” lvl? (1 — cos? 8) = Jul? [vl? sen? 6. 


! 


De donde se sigue (vii), pues todos los factores son positivos. 


Corolario 5.3 La magnitud de u x v es el área del paralelogramo 
generado por u y v. 


Demostración.Si tomamos a u como base del paralelogramo, 
entonces su altura es [v|sen 0; y el corolario se sigue de (vii).  U 


Corolario 5.4 Los vectores u y v son paralelos si y sólo si su producto cruz, U X V, 
es igual a O. 


Demostración. Esto se sigue de (vii), pues u y v (no nulos) son paralelos si y sólo 
si el ángulo O entre ellos es 0 o TT, y esto sucede si y sólo si sen 0 = 0. Ol 


Nótese además que si u o v son el vector cero, entonces su producto cruz también 
es cero. Por lo tanto tenemos que u y v generan un plano si y sólo si su producto 
cruz es distinto de cero, y en este caso u x v es normal a ese plano. 


EJERCICIO 5.3 Encuentra una ecuación normal para los siguientes planos: 

MTM =(Q+t-=s,1-2t+s,3t-s—3)|t,s€R) 

M=((a+fB-2y, 2a-28B+Yy,3a+ B=y)la, PB, y ER; a+ B+y=1) 

M3 =[(Qa+P=y, a—3B+Y,a—PB+y)la, Pp, yeR; a+ p+y=1) 

Ta =1(3+2t+8,28s-—t,t+5s-3)|t,s€R) 

EJERCICIO 5.4 ¿Cuáles de las siguientes cuartetas de puntos en R3 son coplanares? 
Y si lo son define el plano en el que están. 

a = (2,-1,0),b = (1,2,-2),c=(0,1,0),d = (4,—1,—1). 

a = (2,-1,0),b =(1,2,-2),c=(0,1,0),d =(3,-—1,—1). 


EJERCICIO 5.5 Encuentra un criterio general para saber si cuatro puntos a, b, c, 
d € R3 son coplanares o no, y demuéstralo. 


5.1.2 Intersección de planos 
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Consideremos dos planos dados por una ecuación normal 


T ; n¡:x=d; (5.2) 
Th : Nn-Xx=d»p. 


Supongamos que sus dos vectores normales no son paralelos. 
Entonces el vector d := n; xn, es no nulo por el Corolario 5.4. 
Ésta es la única “dirección común” a los dos planos, pues es 
normal a los dos vectores normales; de tal manera que la recta 
donde se intersectan debe tener esa dirección. Supongamos 
que p es una solución particular al sistema de dos ecuaciones 
con tres incógnitas anterior, es decir, que p es un punto en la 
intersección: p € MT, NTl,. Vamos a demostrar que entonces la recta 


l=[(p+td|teR) 


es precisamente la intersección. 
Primero veamos que un punto en l satisface las ecuaciones (5.2). Para 1= 1,2 se 
tiene: 


ni-(p+td) = m-p+n-(td) 
= n; -p+t(n;:d)=n;-p=d; 


pues n; - d = 0 por definición de d. Lo que demuestra que l € TM, NT. Y por el otro 
lado, si q € TM; N TI probaremos que q — Pp es paralelo a d, para lo cual usamos el 
criterio del Corolario 5.4 y el Teorema 5.2: 
dx(q-p) = dxq-dxp 
= (mxn)xq-(mxnm)xp 
(nm -q)n2-— (m-q)n, — (n; -p)n2 + (nm -p)n; 
= dim-d.m-d¡nm+d.m =0. 


Hemos completado la parte central de la demostración del siguiente teorema. 


Teorema 5.5 Dos planos en R* se intersectan en una recta si y solo si sus vectores 
normales no son paralelos. En caso contrario, o no se intersectan (son paralelos) o 
son el mismo plano. 


Demostración. Nos falta nada más afinar detalles. Primero, suponiendo que los 
vectores normales no son paralelos, tenemos que ver que existe una solución particular 
p como la que usamos arriba; y segundo, observar que cuando son paralelos, que 
exista o no esta solución particular determina los dos casos correspondientes. Para 
esto, consideremos al sistema (5.2) en coordenadas: 


ax+biy+ez = d; 


a x+b2y+c2z = do. 
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Para encontrar una solución particular podemos asignar un valor arbitrario a cualquiera 
de las variables y resolver el sistema 2 x 2 que queda. Lo más fácil es hacerla 0; por 
ejemplo si z = (0 tenemos un sistema 2 x 2 clásico (en x y y) que tiene solución única 
dependiendo de su determinante. Puesto que las coordenadas del producto cruz son 
precisamente (+) estos determinantes, que los vectores normales no sean paralelos 
implica que alguno de los tres subsistemas 2 x 2 que se obtienen al hacer una vari- 
able 0 tiene determinante no nulo y por tanto tiene solución. En el caso en que son 
paralelos los vectores normales, entonces los lados izquierdos son múltiplos: si las 
constantes lo son por el mismo factor, definen al mismo plano, pero si no lo son no 
existen soluciones comunes. O 


Asi que las rectas en R% se pueden determinar por dos ecuaciones lineales o bien 
describirse paramétricamente. 


EJERCICIO 5.6 Encuentra una descripción paramétrica para la recta de intersección 
de las siguientes parejas de planos: 

TM :2x+y=z=l; Il:-2x+y-3z=3. 

T:ix=y=z=0; M:x+y=z=1. 

TM :2x+y=z=2; I:—x+y-2z=2. 

TM :2x+z=1l; TIhl:-2x+z=3. 

EJERCICIO 5.7 Describe las siguientes rectas intrínsecamente, es decir, como las solu- 
ciones de dos ecuaciones lineales: 

li =[(Q+t,1-—2t, 3t-3)|tcR) 

lo =1(s, 2-3s,2s-—3)|s € R). 


EJERCICIO 5.8 — Sea Il el plano dado por la ecuación nN - Xx = C y sea l la recta 
tp+td|teR). Demuestra (sustituyendo la expresión de los puntos de l en la ecuación de 
TT) que TT y £ se intersectan en un único punto si y sólo si n- d 4 0. Observa que si no es así 
(es decir, si n - d = 0) entonces la dirección d es paralela al plano; por tanto demostraste 
que un plano y una recta se intersectan en un único punto si y sólo si la direccion de la 
recta no es paralela al plano. 


EJERCICIO 5.9 Sean u,v, w tres vectores tales que (u x v) - w 4% 0. Demuestra que 
tres planos normales a U, v y w respectivamente se intersectan en un único punto. 


5.1.3 El determinante y la orientación 


Dados tres vectores u, v, w € R?, definimos su determinante como el número real 
) ) ) 


det(u,v,w) = (uxv).w 
= (vxw)-u (5.3) 
= (wxu).v, 
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donde hemos usado la propiedad (v) del producto cruz y la simetría del producto 
punto. El determinante tiene el siguiente significado geométrico. 


Proposicion 5.6 Dados tres vectores u,v, w € R*, su determinante es el volumen 
signado del paralelepípedo que definen, y el signo corresponde a su “orientación”. 


Demostración. Consideremos la fórmula det (u,v,w) = (u x v) - w. Sabemos 
que ju x v| es el área del paralelogramo u,v que podemos tomar como base del 
paralelepípedo en cuestión. Y por la fórmula geométrica 
del producto punto tenemos entonces que 


det (u, v, w) = lu x vi [w| cos a, 


donde a es el ángulo entre w y u x v. 


Supongamos primero que 
0 < a < 1/2. Entonces, 
en el plano generado por w 
y u x v (en el que el plano 
(u, v) —generado por u y 
v, recuérdese— se ve como la línea perpendicular a u x 
v), es fácil ver que la altura del paralelepípedo es |w|cos ax 
y se sigue el resultado: tenemos que det (u,v,w) es 
“base por altura”. Si 711/2 < a < tt entonces [w| cos a 
es también esa altura pero con signo negativo. Corre- 
sponde a que w vive en el otro lado del plano (u, v) en 
el que está u x v. Pero en valor absoluto, det (u,v, w) sigue siendo el volumen del 
paralelepípedo que definen u, v, w. Ol 


El producto cruz u x v “escoge” un lado positivo del plano (u, v); los vectores 
w que están en ese lado (un semiespacio) ven el giro de u a v como la orientación 
positiva del plano R? (en contra de las manecillas del reloj). Por convención en cómo 
se coloca la base canónica, el lado positivo corresponde a la regla de la mano derecha: 
si con la punta de los dedos de la mano derecha simulamos el giro de u a v, entonces 
el pulgar apunta hacia el lado positivo del plano, hacia u xv. Para los vectores w que 
están en el otro lado, el negativo, decimos que la terna u, v, w induce la orientación 
negativa a R3. 
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Así, por ejemplo, la terna canónica e;, ez, ez en su orden canónico tiene orien- 
tación positiva, pero la terna e,, e, ez tiene orientación negativa. De tal manera 
que si ponemos las coordenadas de la pantalla de una computadora con el eje x (e) 
horizontal a la derecha (como se lee), y el segundo eje (y o el vector 


ez) hacia arriba; entonces el lado positivo del eje z (o el tercer vector e, 
canónico € = €y X e) apunta hacia nosotros. Pero si decidiéramos 

que el lado positivo del eje z vaya hacia atrás, hacia el otro lado de la 8 E 
pantalla, y disponemos los vectores de acuerdo con estas coordenadas, ll E 
entonces las ternas con determinante positivo corresponden a las que E ? 


cumplen la regla de la mano izquierda, pues la base canónica lo hace y 
se cumple que det (I) = 1 > 0. En fin, es una convención que depende de cómo se 
situe la base canónica; aquí podemos suponer que es como en la figura, con la regla 
de la mano derecha. 


Proposicion 5.7 Sean u y v dos vectores que generan un plano (u,v) en R*. En- 
tonces w está en el plano (u,v) si y sólo si det (u,v, w) =0. 


Demostración. Por el Corolario 5.4 tenemos que u x v % O. Entonces el plano 
definido por la ecuación (u x v) -x = 0 es precisamente el plano generado por u y v, 
y se sigue la proposición, pues det (u, v, w) = (u x v) - w. O 


En términos de la Proposición anterior, w está en el plano (u,v) si y sólo si el 
volumen del paralelepípedo definido por u, v, W es cero. 


EJERCICIO 5.10 Demuestra que el determinante cumple las siguientes propiedades 


i) det (u,v, w) = — det (v, u, w) = — det (u, w, v) = — det (w, v, u) 
ii) det (u,u,v) =0 
iii) det (tu, v, w) =1t det (u, v, w) 
iv) det (u+x,v,w) = det (u, v, w) + det (x, v, w) 


EJERCICIO 5.11 Demuestra, usando únicamente el ejercicio anterior, que el deter- 
minante no cambia si sumamos un múltiplo de un vector a alguno de los otros, es decir, 
que 

det (u, v + tu, w) = det (u, v, w). 


5.1.4 Sistemas de ecuaciones 


Aplicaremos ahora el producto cruz a la resolución de sistemas de tres ecuaciones 
lineales con tres incógnitas. Como vimos en el Capítulo 3, tal sistema se puede 
escribir como 

Ax = b, 
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donde A es una matriz de 3 x 3, x es el vector variable, o de las incógnitas (x, y, Z), 
y b € R* es un vector constante. Si denotamos por u, v, w a las columnas de A (es 
decir, si A = (u,v, w)) entonces es natural definir el determinante de la matriz A 
como 


det A = det (u,v, w) = (u x v) . w 


y tenemos: 
Teorema 5.8 El sistema Ax = b tiene solución única si y sólo si det A 4 0. 


Demostración. Si pensamos el sistema de ecuaciones Ax = b como tres ecuaciones 
lineales y por lo tanto, si son no triviales, como tres planos, la solución del sistema es 
la intersección de los tres planos. Por la Sección 5.1.2 y los Ejercicios 5.8 y 5.9 se tiene 
una buena párte del Teorema. Pero nótese que entonces los vectores importantes, los 
normales a los planos, corresponden a los renglones de A (digamos que son n;, n,, 
n3) y habría que revisar que el determinante se calcula igual (det A = (n; x nz) -n3, 
es decir, det A = det A'). De alguna manera, ya hicimos parte del trabajo. Pero 
veamos otra demostración pensando en la matriz A como tres vectores columna. 
Con la notación del párrafo anterior (A = (U,v,w), y x = (x,y,z)' el vector 
variable o incógnita), el sistema Ax = b es equivalente a la ecuación vectorial 


xu+yv+zw=b, 


donde todos los vectores están dados. Tomando el producto punto con el producto 
cruz de dos de los vectores se eliminan las dos variables correspondientes. Así, para 
eliminar x y y de un solo golpe, tomamos el producto punto con (u x v) para obtener 
la ecuación 

z ((uxv).w) =(uxv)-b, 


pues (u x v) es ortogonal a u y a v. De aquí, si (u x v) - w = det A 4 0, se tiene que 


_ (uxv)-b 
det A 


Y análogamente, por (5.3), det A 4 0 implica que 


(wxu)-b (vx w)-b 


di detA  ? qe det A 


Por lo tanto, si det A % O entonces la solución de Ax = b es única y está dada por 
las fórmulas anteriores que son conocidas como “la regla de Krammer”. 

Ahora tenemos que demostrar el inverso. Supongamos entonces que detA = 0 
y hay que ver que el sistema no tiene solución única. Expresemos el determinante 
como det A = (u x v) - w. Si (u x v) =0 entonces por el Corolario 5.4 tenemos que 
u y v son paralelos, y si (u x v) % 0, entonces por la Proposición 5.7 tenemos que 
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w € (u,v). En ambos casos podemos afirmar que existen números Xo, Yo y Zo con 
alguno de ellos distinto de cero que cumplen 


Xx U+yov+Zzw=0, (5.4) 


pues en el primer caso (u x v = 0) tenemos una igualdad u = sv o v = ru, y en 
el segundo (u x v 4 0) podemos expresar w = ru + sv; y de cualquiera de estas 
igualdades obtenemos una expresión (5.4) con alguno de los coeficientes igual a 1 al 
pasar todos los sumandos al lado izquierdo. 

Esto implica que el sistema homogéneo Ax = O no tiene solución única pues 
encontramos una diferente de la trivial que es x = 0. Resumiendo, si suponemos que 
det A = 0, hemos demostrado que existe Xo = (xo, Yo, Zo) 4 O tal que Axo = 0. Ésta 
será la base para demostrar que para cualquier b € ¡R* la solución de Ax = b no es 
única: 

Si el sistema Ax = b no tiene solución (el caso, por ejemplo, en el que w está 
en el plano generado por u y v pero b no está en ese plano) entonces, en particular, 
no hay solución única. Pero si Ax = b sí tiene solución, digamos que x¡ es tal que 
Ax = b, entonces X¡ + Xy también es solución, pues 


A(x¡ +Xo) = Ax + Axo =b+0=0b. 


Y como X¡ % X¡ + Xy pues Xy % O entonces la solución no es única. Dicho de otra 
manera, si existen x1,y1 y 21 tales que 


Xx U+Y1V+ZwW=b, 
entonces también se cumple que 
La + xo) u+ (y1 + Yo) v+ (21 + zo) w = b. 


Lo cual concluye la demostración del teorema pues que no haya solución única quiere 
decir que o bien no hay solución o si sí la hay, entonces hay muchas (en el fondo 
hemos demostrado que cuando las hay, hay tantas soluciones como las hay para el 
sistema homogéneo Ax = 0). O 


EJERCICIO 5.12 Sea A = (u,v,w) una matriz de 3x 3 con det A X% 0. Demuestra 
que entonces tiene matriz inversa A”! y que ésta está dada por la fórmula 


(vx w) 
== ona (wxu)' 
detA ; 


lux y)! 


donde, recuerda, x! es el vector renglón transpuesto del vector columna x. 


...Dibujo 
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5.1.5 Dependencia e independencia lineal 


En la demostración del regreso (si det A = 0, la solución no es única) del teorema 
anterior hubo un paso fundamental que amerita comentarios y profundización. El 
de encontrar una solución no trivial a la ecuación homogénea Ax = 0, porque es 
la manera más democrática y general de decir que las columnas de la matriz A no 
son tan generales como podrían ser; que en vez de generar todo IR3 sólo generan un 
plano o una línea o el origen (si las tres son 0). Amerita una pomposa definición 
que funciona en general, aunque en este libro sólo se le dé uso en instancias pequeñas 
(k<4 y n< 3). 

Definición 5.1.1 Sean u;, uz,::: ,Uuz vectores en RR”. Se dice que son linealmente 
independientes si 


k 
DA 00 > A=A=--:=A4=0, 


i=1 


es decir, si la única combinación lineal de ellos que da el vector O es la trivial. Y si, 
por el contrario, existen A¡,A2,--- ,Ax no todas ellas cero, tales que A¡ Uy + Á2 u)2 + 
«++ + Az uz = 0, entonces se dice que son linealmente dependientes. 


Así se tiene que un vector es linealmente dependiente si y sólo si es el vector 0; 
que dos vectores no nulos son linealmente dependientes si y sólo si son paralelos, y 
que tres vectores son linealmente dependientes si y sólo si los tres están en un mismo 
plano por el origen. Estos son los casos que nos interesan y han quedado debida y 
elegantemente incluidos en una sola definición. Podemos decir entonces que el paso 
fundamental de la demostración anterior fue ver que det A = 0 si y sólo si las columnas 
de A son linealmente dependientes. A estas matrices (con determinante cero) se les 
llama matrices singulares, y correspondientemente una matriz A es no singular si 
detA X0. 

A manera de resumen, enlistemos una serie de equivalencias, cuya demostración o 
bien ya dimos o bien falta sólo algún argumento sencillo que dejamos como ejercicio 
mental para el lector. 


Teorema 5.9 Sea A = (u,v,w) una matriz 3 x 3, y sea f : ¡R3 —= R3 su fun- 
ción lineal asociada (es decir, definida por f(x) = Ax ). Entonces son equivalentes: 
¿) dtA HO (A es no singular) 
11) u,v, w son linealmente independientes 
11) el sistema Ax =b tiene solución única para alguna b € R? 
iv) el sistema Ax =b tiene solución única para toda b € R* 
v) (u,v,w) =R?  /(i.e., u,v,w generan R?) 
vi) f es inyectiva 
vit) f es suprayectiva 
viti) $ es biyectiva 
ix) A es invertible (existe A? tal que AA =1). 
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EJERCICIO 5.13 Demuestra que tres planos en R* se intersectan en un único punto si 
y sólo si sus tres vectores normales son linealmente independientes. 


EJERCICIO 5.14 Sean dy, d>, d3 linealmente independientes, y sean l¡ y fl, dos rectas 
cualesquiera con direcciones dy y d) respectivamente. Demuestra que existe una única recta 
f3 con dirección d3 que pasa por fl; y l>. 


...Dibujo 


5.2 La esfera 


Ahora sí, estudiaremos algo de la geometría de la esfera: 


S?:= fx ER? | lx] =1), 


es decir, el conjunto de todos los vectores unitarios (de norma 1) en R3. No está de 
más remarcar que es la frontera de la “bola sólida” B* := fx E Ri | lx] < 1) y que si 
bien esta última tiene tres dimensiones, su frontera, la esfera, tiene sólo dos; así que el 
exponente se refiere a la dimensión (se lee “ese dos”). Y conviene esta notación pues 
es parte de una familia, la esfera de dimensión n vive en el espacio euclidiano de la 
dimensión siguiente, R”+!, y ahí se define como el conjunto de vectores de norma 1. 
De esta familia ya estudiamos el círculo unitario S', pero también hay una esfera de 
dimensión 3 y es interesante irse preguntando qué cosas valen ahí, aunque aquí sólo 
nos referiremos a la de dimensión 2. Intrínsecamente S? es una superficie y su símil 
más parecido en el mundo real son las pompas de jabón. 

Por su parte, la esfera es la representante teórica de cosas importantes como 
la superficie de la Tierra o el firmamento. Siguiendo este símil, podemos dar dos 
coordenadas angulares para sus puntos. El ecuador consta de los puntos 


e, [(cos ax, sen x,0) | x € [0,277]), 
donde a es llamada la longitud, y se identifica naturalmente 
con el círculo unitario S'. Y luego, para una longitud x dada 
/ podemos variar la altitud $ € [—1t, 71] para obtener el punto 
qe e, 
SO AU Xa.s = [cosó cos ax, cos ó sen ax, sen d) , 
que efectivamente está en la esfera pues 
Kai ? = (cosócos a)? + (cos ó sen a)? + sen? 5 


cos? $ (cos? a + sen? a) + sen? Ó 


= cost ¿+senti=1. 
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Así que podemos llegar a cualquier punto de la esfera por sus dos coordenadas, 
longitud a y altitud $, pero para el “polo norte”, ez, y el “polo sur”, —ez, la longitud 
no está bien definida; cualquiera es buena. Los mapas planos de la Tierra usan estas 
coordenadas, pero entonces los polos “son” las líneas horizontales extremas y las 
distancias no corresponden a las distancias reales en la esfera. Tampoco las líneas 
rectas en un mapa corresponden a las trayectorias más cortas en la esfera. 


5.2.1 Líneas esféricas y polaridad 


Consideremos dos puntos u y v en la esfera S?. ¿Cuál será 
la trayectoria más corta para ir de u a v? Nos referimos a la 
trayectoria dentro de S?, es decir, sin salir nunca de la esfera, 
como si fuéramos una hormiga sobre ella o un ser humano en 
la Tierra. En R* la trayectoria más corta es el segmento UV 
entre los puntos; pero éste inmediatamente deja de estar en la 
esfera, y su interior cae dentro del interior de la bola sólida. 
Lo que más se parece al segmento UV dentro de la esfera es 
su proyección desde el origen, su sombra en la esfera pensando 
que el centro de la esfera, el origen, es un foco. Pues entre más 
grande sea el radio de un círculo más se parece localmente a 
una recta y los círculos más grandes que hay en la esfera son los que tienen su centro 
en el origen, y que por tanto tienen radio uno. 

No vamos a demostrar que las trayectorias más cortas (o eficientes) dentro de la 
esfera son los círculos máximos (i.e., intersección de la esfera con planos por el origen) 
pues ello requiere herramientas de cálculo. Pero las vamos a tomar como definición 
de líneas esféricas (que, aunque suene contradictorio, viene de “líneas en la esfera”) 
siguiendo la intuición de que son lo más parecido a las líneas rectas dentro de S?. 


Definición 5.2.1 Una línea en la esfera, o una línea esférica es la intersección de S? 
con un plano por el origen. 


Nótese que cada línea esférica es (una copia de) el círculo unitario S' pues consta 
de los vectores de norma 1 en un plano. 

Veamos ahora que por dos puntos u y v en la esfera S? siempre pasa una línea 
esférica. Hay que considerar dos casos. Si u y v son no paralelos, 
entonces generan un plano (por el origen) (u,v) de tal manera 
que la línea esférica 

E = (uv) ns? 


los contiene a ambos. Y si u y v son paralelos entonces están 
contenidos en una línea por el origen y (al ser de norma 1) o bien 
son iguales, o bien son antípodas, es decir, u = —v (“forman un 
S%”); y en este caso, todas las líneas por uno también contienen 
el'antípoda. Hemos demostrado que por cualquier par de puntos pasa una línea que 
además es única si y sólo si no son antípodas. 
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Esta condición es muy parecida a la de la geometría 
clásica del plano euclidiano donde por cualquier par 
de puntos pasa una recta. Pero a diferencia del 
plano euclidiano, en la esfera no hay paralelismo. 

Cualquier par de líneas esféricas se intersectan 
en un pareja de puntos antípodas. Como los planos 
que las definen pasan por el origen, entonces se in- 
tersectan en una línea por él, que intersecta la esfera 
en una pareja de antípodas. 


Polaridad 


Puesto que en IR3 tenemos que líneas y planos por el origen están 
naturalmente apareados por ortogonalidad, la esfera hereda este | 
apareamiento que llamaremos polaridad: 

Decimos que una línea esférica y un par antípoda en S? son 
polares si el plano por el origen y la línea por el origen correspon- A 
dientes son ortogonales. La polaridad da una correspondencia cdi 
biyectiva natural entre los S' y los S% de S?. En la Tierra, por 
ejemplo, el ecuador es polar de los polos (norte y sur). 

Si tomamos en cuenta la orientación de R* podemos refinar nuestra noción de 
polaridad. A una línea esférica € le podemos dar dos orientaciones, es decir, maneras 
preferentes de viajar en ella. Si denotamos por € a la línea esférica € orientada (con 
una orientación dada), entonces de su par antípoda de polos podemos 
escoger uno al que llamaremos su punto polar: tomamos cualquier punto 
u € €£, viajamos en la orientación preferida de € un cuarto de vuelta 
para llegar a un punto v, y luego tomamos u x v (por la manera que 
escogimos v se tiene que u x v € S?) y el resultado no depende de 
u. Geométricamente, y de acuerdo con nuestra convención de cómo 
tomar la base canónica, si con los dedos de la mano derecha emulamos, 
seguimos, la orientación de €, el pulgar apunta hacia su punto polar; 
o bien, si caminamos sobre E de frente y de acuerdo con su orientación, a nuestra 
izquierda está su punto polar. Se tiene entonces que a las dos orientaciones de € 
corresponden sus dos puntos antípodas polares (pues u x v =— (v x u)); y a cada 
punto de S? le corresponde una línea esférica orientada, llamada su polar. 


5.2.2 Distancias y ángulos 


Hemos usado intuitivamente que hay una distancia natural en la esfera S?, formali- 
cémosla. Dados dos puntos u y v en S?, hay una línea esférica € que los contiene; 
como es un círculo de radio 1, el recorrido mínimo entre u y V a lo largo de € es 
precisamente el ángulo, medido en radianes, entre los vectores U y V. Así que hay 
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que definir la distancia en la esfera de U a v como 
ds: (u, v) := ang (u, v). 
Recordando la definición de ángulo entre vectores (1.10.2) que se deriva de la fórmula 
geométrica del producto interior, u - v = Jul [v|cos (ang (u,v)), y usando que [ul = 
lv| =1 (pues están en S?) se obtiene que 
de: (U, v) = arccos (u - v). 
Cuando sea obvio que nos referimos a la distancia en S?, y no se confunda con la 


distancia en IR3, olvidaremos el subíndice. En la práctica, la fórmula equivalente que 
más utilizaremos es 


u - v=COs (ds: (u, v)). 


Como el arcocoseno toma valores en el intervalo [0, 71], se tiene entonces que para 
todo u y ven S?, 


0 < de (u,v) < rr, 


donde las igualdades, o extremos, se dan sólo cuando u y v son el mismo punto, y su 
distancia es 0, o bien cuando son antípodas y logran el máximo rr. Y es claro también 
que la línea polar a un punto u consiste justo de los puntos a distancia 71/2 de él (y 
que equidistan de su antípoda). 

Para ver que esta distancia cumple con todas las de la ley (las condiciones del 
Teorema 1.11.1) nos falta probar la desigualdad del triángulo, d (u,v) < d(u,w) + 
d(w,v). Pero conviene dejarlo para después, pues se usará la ley (esférica) de los 
cosenos en la que interviene la noción de ángulo. 

Como sucedió en el plano, el ángulo entre dos líneas no está bien definido, pues 
se puede tomar cualquiera de los dos ángulos complementarios que definen. Pero 
esta ambigúedad se pierde si las líneas están orientadas y se mide entonces, e intu- 
itivamente, el movimiento angular que gira una en la otra haciendo corresponder las 
orientaciones. Formalmente, consideremos dos rectas orientadas €, y € (nótese que 
eliminamos la flechita de la notación, pues aquí estorba más de lo que 
ayuda) y sean, respectivamente, U y v sus puntos polares. Obsérvese 
que u y v están en la línea polar al par de antípodas ¿A [, y que al 
mover u hacía v en esta línea, la polar a u gira justo alrededor de la 


intersección £ N € para llevar a €, con la orientación adecuada, a (. De 
tal manera que debemos definir el ángulo entre €, y € como hk Y 


ang (8, 8) := ds: (u, v) . 
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Para que esta fórmula quede únicamente en términos de las líneas orientadas, 
debemos introducir notación para la polaridad. 
Notación 5.1 Si ¿ es una línea esférica orientada, denotamos por ¿+ (léase “E polar”) 
asu punto polar; y para un punto u € S? denotamos con u* a su línea polar orientada. 
De tal manera que En] =é Y (u!)” = u. (No hay que confundir la notación con 
el compadre ortogonal en R?, que ya no usaremos.) 


Y entonces tenemos que si € y Z son líneas orientadas, y u y v puntos en S?: 
ang (8,8) = ds: (87,2) y ds (u,v) =ang (u*,v"), (5.5) 


y además que 
uc 5 ¿Eg eu. 


Ángulos diédricos 


Generalizando, se puede definir el ángulo entre dos planos para que el ángulo entre dos 
planos por el origen sea justo el ángulo entre las líneas esféricas correspondientes. De 
nuevo hay una ambigiúedad, pues puede uno referirse a un ángulo o su complementario, 
que se resuelve orientando. Si un plano orientado es un plano junto con un lado 
positivo distinguido, ¿.e., un vector normal, unitario digamos, especificado, entonces 
el ángulo entre dos planos orientados (ángulo diédrico o diedro, como a veces se le 
llama) es el ángulo entre sus vectores normales. 

Otra manera de verlo, o medirlo, es tomando un plano TT perpendicular a los dos 
planos dados, es decir, ortogonal a su línea de intersección. En TT, los dos planos se 
intersectan en dos rectas; la orientación como lado preferido nos da líneas orientadas, 
y el ángulo diédrico entre los planos es el ángulo entre las líneas de intersección. O 
bien es el ángulo entre las líneas esféricas que definen al intersectarlos con una esfera 
centrada en su línea de intersección. 


EJERCICIO 5.15 ¿Cómo son los círculos en la esfera? Es decir, ¿cómo son los conjuntos 
Íx € S? | dez (u,x) = r) con u € S? fijo (el centro del círculo) y r > 0 constante (el radio)?. 


EJERCICIO 5.16 Demuestra que para cualquier par de puntos u, v € S? se tiene que 


ds? (u, v) + de? (u, —v) = T. 
EJERCICIO 5.17 Sean € y € dos líneas esféricas. Demuestra que son ortogonales (1. e. 
que ang (€, 7) =71/2 con cualquier orientación que se les dé a las líneas) si y sólo si EE 
donde ¿” denota al par antípoda polar a € cuando ésta no tiene orientación preferida. 
EJERCICIO 5.18 Demuestra que por cualquier punto u € S? se puede trazar una línea 
ortogonal a una línea dada €; y que además ésta es única si y sólo si u no es polar de €. 


EJERCICIO 5.19 Sean €] y €2 dos líneas esféricas ortogonales. Demuestra que hay 
una única línea £3 ortogonal a ambas. ¿Usaste el hecho de que fueran ortogonales? 
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EJERCICIO 5.20 Sean u y v dos puntos no antípodas en S?. Demuestra que la línea 
por u y ves (u+ n vi)”, dándole sentido a este abuso de notación. 


EJERCICIO 5.21 Demuestra que la distancia esférica se puede escribir en términos de 
la euclidiana como 
ds: (u, v) = 2 arcsen (dp (u, v) /2) 


y describe la función arcsen. 


5.2.3 Área y triángulos 


En la esfera, los ángulos también miden área. Si tomamos un ángulo entre dos rec- 
tas junto con su opuesto por el vértice, obtenemos dos gajos, llamémoslo un bigajo, 
determinado por el ángulo a entre las rectas. Al crecer ax, el área del bigajo cor- 
respondiente, que denotaremos ga, crece proporcionalmente —o mejor 
dicho, linealmente— pues el área del bigajo con ángulo x/2, digamos, 
es justo la mitad del área de gu ya que dos Qa/2, sin traslaparse, cubren 
a ga; y lo mismo sucede para cualquier entero n en vez de 2. Así que 
debe haber una constante c tal que 


A(9u) =Cc a, 


donde A representa el área. Puesto que el área del bigajo de ángulo TT ya es el área 
de toda la esfera, también se tiene que 
A (s?) =61 

Arquímedes calculó el valor de la constante c para cualquier esfera. Se tiene que 
e = 41?, donde r es el radio, y como en nuestro caso el radio es 1, la constante c que 
aparece arriba es 4. Aunque lo que nos interesa aquí es que exista, pues su cálculo 
preciso requiere de ideas de cálculo que están al margen. 

Consideremos ahora una tercera línea que no pase por la intersección de las dos 
anteriores. No es difícil ver que entonces la esfera se parte en ocho triángulos, aparea- 
dos en cuatro parejas de antípodas. Sea T uno de estos triángulos con «, (3, y sus 
ángulos internos, y sean Ja, 94, 9y los bigajos correspondientes. Si pintamos el bigajo 
Ya, luego todo el bigajo gg y finalmente el g,, habremos pintado toda la esfera; pero 

tanto al triángulo T como a su antípoda le dimos tres manos, mien- 
tras que a los otros seis sólo una. Midiendo el área por la pintura 
que se uso (cubrir la esfera S?, dos manos adicionales para T y dos 
para su antípoda, que miden lo mismo) se obtiene que 


A(9a) + Algg) + Al(gy) = A(S) +44 (T), 


de donde, sustituyendo nuestras otras igualdades, concluimos que 


A(T) =¿ (04 pB+y—m. 
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Como el área es estrictamente positiva, esto implica que la suma de los ángulos 
internos de un triángulo esférico es estrictamente mayor que 7. Pero la fórmula ante- 
rior nos dice mucho más: que el exceso sobre 71 es proporcional al área del triángulo; si 
la suma se excede un poco es porque el triángulo es muy pequeño y se asemeja a uno 
plano. Para enunciar elegantemente el teorema que ya hemos demostrado, usaremos 
el valor de la constante que encontró Arquímedes. 


Teorema 5.10 La suma de los ángulos internos de un triángulo esférico es mayor 
que Tt; y el exceso sobre TT es su área. Ol 


EJERCICIO 5.22 Demuestra que tres planos en R* se intersectan en un único punto si 
y sólo si la suma de sus ángulos diédricos es mayor que T. 


EJERCICIO 5.23 ¿Cuál es el máximo valor de la suma de los ángulos internos de un 
triángulo esférico? Da ejemplos de triángulos que se aproximen tanto como uno quiera a 
este valor. 

EJERCICIO 5.24 Demuestra que hay tres tipos de triángulos esféricos regulares (con 
sus tres ángulos iguales) con ángulo de la forma 21/n. En cada caso, ¿con cuántos de ellos 
se cubre la esfera? 

EJERCICIO 5.25 Define polígono regular en la esfera y argumenta que para cada a 
con 


n-—2 
——T<A<N 
n 


hay un polígono regular (esférico) con n lados y ángulo interno «. 


5.2.4 Trigonometría esférica 


Sigamos analizando el triángulo T que tenemos entre manos. Si los ángulos 
internos determinan el área, también deben determinar la longitud de 

B los lados. Denotemos con a, b, e los vértices del triángulo con ángulos 
correspondientes ax, (3, y; y, abusando de la notación, denotemos con A, B, 
C tanto a las líneas orientadas de los lados opuestos como a las distancias 
correspondientes (e.g., A = de: (b, c)). 


Lema 5.11 (Ley esférica de cosenos) Con la notación anterior se tiene que 


cos A —cos B cos C cos A + cos (3 cos y 
COS A = y cos A = —_—_———_———- 


sen B sen € sen (3 sen y 


Demostración. La primera ecuación se sigue de las dos interpretaciones que le 
podemos dar a (ax b)-.(ax e). Primero, con un desarrollo similar al final de la 
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demostración del Teorema 5.2, se obtiene 


(axb)-(axc) = a-(bx (ax c)) 
= —a-((axc)xb) 
= —a-((a.b)e—-(c-b)a) 


(c-b)(a-.a)—(a-b)(a:c) 
= cosA—cosC cosB. (5.6) 


! 


Por otro lado, usando el Teorema 5.2 se tiene que |a x b| = [al 'b| sen C = sen C; 
pero además sabemos que ax b está en la dirección de C+ (aquí estamos interpretando 
por primera vez a C como línea orientada y tomando su punto polar). Entonces 
tenemos que 

a x b = (sen C) C?. 
Análogamente, cuidando la orientación, tenemos que ex a = (sen B) B-, y por tanto, 
(axb).(ax ec) —(axb). (exa) 
— ((sen C) ES . ((sen B) B>) 
(sen Csen B) (—C* . B+) 
= sen Csen B cos ax, (5.1) 


donde estamos usando que para medir el ángulo interior, hay que cambiarle la orien- 
tación a alguno de los lados. 

De (5.6) y (5.7) se sigue la primera fórmula del lema. 

La segunda se sigue de la primera por polaridad. Si consideramos los tres puntos 
polares a los lados orientados del triángulo T, obtenemos un triángulo cuyos lados 
orientados son las líneas polares a los tres vértices de T. Y en este trián- 
gulo, “polar” podríamos llamarlo y que denotamos T+, lo que miden 
los lados es lo que miden los ángulos externos de T por (5.5). Si deno- 
tamos A al complemento de ax € [0,71], es decir, % := TT— X, entonces 
los lados de T+ miden x, f, y correspondiendo a las líneas a+, b*, c+ 
respectivamente. Análogamente, los ángulos internos de T+ miden A, 
B, C, respectivamente. Puesto que cos9 =—cos 8 y sen 0 = sen 0 para 
cualquier O € [0,71], la primera fórmula (que ya está demostrada para 
cualquier triángulo) en el “polar” T+ da entonces la segunda fórmula del lema. Ol 


Como corolario (de la segunda fórmula) obtenemos que los ángulos de un triángulo 
esférico determinan la longitud de sus lados, a diferencia del plano euclidiano, y 
entonces no hay “semejanza” en los triángulos esféricos. Pero, como antes, los lados 
de un triángulo determinan a sus ángulos (por la primera fórmula). 


Lema 5.12 (Ley esférica de senos) Con la notación del lema anterior se tiene 


senA senB  senC 


senx  senf  seny' 
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Demostración. Aunque hay una demostración algebraica de A 
la ley de los senos usando la de los cosenos, preferimos una ge- 
ométrica que sigue en parte la versión euclidiana. 
Primero hay que ver el caso en que el triángulo es rectángulo; 
digamos que x = 711/2; y para fijar ideas, supongamos que el punto 
a coincide con el primer vector canónico, que el punto b está en 
el plano xz y que el punto c está en el plano xy. Consideremos el 
tetraedro (dícese de un cuerpo acotado por cua- 
tro planos en R3) definido por los tres planos de las líneas (esféricas) 
del triángulo T (que se intersectan en el origen), y el plano TT tan- 
gente a la esfera en el punto b, dado por la ecuación 


b.x=1. 


Este tetraedro tiene cuatro triángulos como caras. Nótese que las longitudes de 
los tres lados de nuestro triángulo esférico original T son ahora los ángulos de los 
tres triángulos que tienen como vértice el origen, y que el ángulo ff es el ángulo en 
el vértice b del triángulo en el plano TT (justo porque TT es tangente a la esfera en 
b). Los otros dos vértices del tetraedro son a” = (a-b)'a ya =1(0c- b) e. No 
es difícil ver que los cuatro triángulos, caras, del tetraedro son rectángulos; dos en 
el vértice b (por ser perpendicular b a TT) y dos en el vértice a” (aquí es donde hay 
que usar que a = 711/2). Entonces tenemos las siguientes igualdades (con distancias 
euclidianas): 


-— d(b,e)” - d(0,c) ” -d(0,c)' 
De donde se concluye que 
E sen B 
n = , 
Ñ sen A 


Nuestro argumento funciona para valores pequeños de A, B y C (como en el dibujo), 
pero no es difícil ver que también funciona para B > 1/2 y C > xn/2. 

Para el caso general, se traza la perpendicular de un vértice, b digamos, al lado 
opuesto; y si D es la altura entonces se obtiene, por el caso anterior en los dos triángu- 
los rectángulos que se forman, que sen asen C = sen D = sen y sen A, 
de donde b 

senA  senC€ 


senx  seny? 


y el lema se sigue por simetría. Oo a c 


Dibujo... 


228 CAPÍTULO 5. LA ESFERA Y EL ESPACIO 


EJERCICIO 5.26 Demuestra que en un triángulo (esférico, se sobreentiende) sus tres 
ángulos son iguales si y sólo si sus tres lados son iguales. Tales triángulos se llaman regulares 
o equiláteros. ¿Cuántos de ellos hay? ¿Puedes parametrizarlos? ¿Por su ángulo? ¿Por su 
lado? ¿Por su radio? ¿Puedes dar las fórmulas que relacionan estos parámetros? 


EJERCICIO 5.27 Demuestra que si un triángulo tiene dos ángulos iguales entonces sus 
lados opuestos son iguales. E inversamente, si tiene dos lados iguales, los ángulos opuestos 
son iguales. Á estos triángulos se les llama ¿sósceles. 

EJERCICIO 5.28 Demuestra que la línea que va del vértice distinto de un triángulo 
isósceles al punto medio de su lado opuesto es perpendicular a éste. Al segmento en cuestión 
se le llama la altura del triángulo. 

EJERCICIO 5.29 Demuestra que el lugar geométrico de los puntos (en S?, se sobreen- 
tiende) que equidistan de dos puntos dados es la línea perpendicular al segmento que los 
une y que pasa por su punto medio. Se le llama la mediatriz. 

EJERCICIO 5.30 ¿Cuánto miden el área, el lado y el diámetro de un cuadrado regular 
con ángulo interno 271/37 

EJERCICIO 5.31 ¿Puedes dar una cota superior para la suma de los lados de un 
triángulo? La inferior es 0. 


5.3 Isometrías de la esfera (O(3)) 


Estudiaremos ahora las transformaciones rígidas de la esfera. Como sabemos, una 
función f : S? — S? que preserva distancias se llama ¿sometría. Veremos primero que 
las isometrías de la esfera corresponden justo a las transformaciones ortogonales de 
R? que habíamos denotado O(3). 

Una transformación ortogonal de R*, por definición, preserva producto interior. 
Por tanto preserva norma y manda a la esfera unitaria en sí misma, pues es el conjunto 
de vectores unitarios. Además, como la distancia en S? se definió con el producto 
interior (es “distancia angular”), también preserva distancias, por lo que su restricción 
a S? es una isometría. 

Inversamente, si f : S? — S? es una isometría queremos demostrar que es la 
restricción de una transformación ortogonal. Sean u =f (e,),v=f(e,) ,w=f (ez). 
Como el triángulo canónico e, ez, ez tiene sus tres lados de tamaño 1/2 (igual que 
sus tres ángulos) y f preserva distancias, entonces el triángulo u, v, w tiene las mismas 
características, que equivalen a decir que u, v, w forman una base ortonormal de R*. 
Nos falta entonces demostrar que para cualquier x = (x,y,z) € S? se tiene que 


f(x) =xu+yv+zw, 


es decir, que f es lineal, pues entonces f será la restricción de la transformación 
ortogonal asociada a la matriz (u,v, w) € O(3). 
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La demostración de que f es lineal (análoga a la que dimos en el Capítulo 3 para 
R2) consiste en reinterpretar geométricamente el teorema de bases ortonormales en 
R? que en la Sección 1.10 dejamos como ejercicio. Por su importancia, lo volvemos a 
enunciar y demostrar. 


Teorema 5.13 (Bases ortonormales) Sea u,v, w una base ortonormal de R*, en- 
tonces para cualquier x € R3 se tiene que 


x= (x-.u) u+(x-.v) v+ (x. w) w. 
Demostración. Para resolver el sistema de ecuaciones 
x=sSsu+tv+rw 


con incógnitas s, t, r, tomamos el producto punto con los vectores dándonos los valores 
de las tres variables por ser u, v, w una base ortonormal. Así, por ejemplo, tomando 
el producto punto con u se tiene 


x.u=s(u-u)+t(v.u)+r(w-.u)=s 
y análogamente t=X-vyT=X-Ww. Ol 
Regresando a nuestra isometría f y un punto cualquiera x = (x,y,z) € S?, se 
tiene que x = Xx - e; mide esencialmente la distancia de x al vector canónico e; (es 


su coseno) y esta distancia tiene que ser la misma que de f(x) a u = f(e;). Más 
formalmente, 


f(x) - u = cos (ds: (f(x) ,f (e1))) = cos (ds: (x, e1)) =x- er. 


Análogamente f (x) -v=x:-e, y f(x) -w= x- e3, de donde, por el Teorema de bases 
ortonormales, obtenemos que 


f(x) = (f(x) -u) u+ (f(x) -v) v+ (f(x) - w) w 
(x- e) u+ (x-e,) v+ (x- e3) w 
= xXU+uyv+zw, 


y queda demostrado que toda isometría de S? es la restriccion de una transformación 
ortogonal de R*. 

Nótese que en el fondo esta demostración (y el teorema) dice que todo punto de la 
esfera queda determinado por sus distancias a los tres vectores canónicos y bajo una 
isometría tiene que ir al punto con las mismas distancias a la imagen del triángulo 
canónico. 

Podemos formalizar lo que intuitivamente es claro, que la esfera es homogénea 
(como espacio) y super-simétrica. Un punto puede ir a cualquier otro punto; si 


Dibujo... 
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además especificamos líneas orientadas por ellos, las podemos hacer coincidir, y nos 
queda la libertad de escoger cómo hacer corresponder a los dos lados de las líneas. 
Pues podemos pensar que una base ortonormal consiste en escoger un punto u, una 
línea orientada que pasa por él (el segundo elemento de la base está a distancia 7/2 
en esa dirección) y luego un lado de la línea (el positivo nos da al producto cruz como 
tercer elemento de la base y el negativo a su antípoda). 

También es claro que ahora tenemos la noción correcta de ¿igualdad de triángulos: 
dos lo son si hay una isometría que mande uno en el otro. Y teoremas tales como 
que dos triángulos son iguales si y sólo si sus lados o sus ángulos (o un lado y sus 
dos ángulos adyacentes, o un ángulo y sus dos lados adyacentes) son iguales. Las 
demostraciones consisten en ir moviendo la esfera para que datos correspondientes 
vayan correspondiendo conjuntista, o estrictamente. 


EJERCICIO 5.32 Demuestra que las clases de isometría de triángulos esféricos co- 
rresponden a las ternas x < B < y con 0 < a, fB, y < Tr, tales que a+ B + y < 21, donde 
ax, KB, y son los lados. 


EJERCICIO 5.33 Decimos que dos triángulos esféricos están en la misma familia si 
ambos se pueden dibujar con tres líneas (recuerda la Sección 5.2.3 de áreas). ¿Cómo se 
relacionan los lados de triángulos en una familia? Demuestra que las familias tienen 4, 2 o 
un sólo elemento, donde la de un sólo elemento es la de los triángulos de bases ortonormales. 


5.3.1 Rotaciones (SO(3)) 


A las matrices ortogonales con determinante 1 se les denota SO(3) por sus siglas en 
ingles special orthogonal group. Corresponden a las isometrías de S? que preservan 
orientación, y que mandan al lado positivo de una línea orientada en el lado positivo 
de su imagen, es decir, que preservan el punto polar de las líneas orientadas. Las que 
invierten orientación (con determinante —1) no forman un grupo y mandan al punto 
polar de una línea orientada en el antípoda del polar de su imagen. 

Ejemplos de isometrías que preservan orientación son las rotaciones, que fijan un 
punto (y su antípoda) y giran la esfera alrededor de ese eje. El teorema principal de 
esta sección es que todas son así; coloquialmente es el “Teorema del gol”: después del 
primer gol, el balón regresa al centro de la cancha e independientemente de lo que le 
haya sucedido en el ínterin, un punto regresa justo a su lugar y el balón solamente 
giró alrededor de él. 

Antes de demostrar el teorema, observemos que las “traslaciones” en la esfera 
también son rotaciones. Una traslación es “empujar” a lo largo de un línea; en la 
esfera una línea es un círculo y “empujar” en él es rotarlo, pero sus puntos polares se 
mantienen fijos, equivale a rotar en ellos. Podemos especificar que rotar en un punto 
u un ángulo x rota a su polar, como línea orientada, un ángulo ax; denotemos esta, 
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isometría Py. Y entonces tenemos que 


Pau E Pa, -—u> 


pues —u le da la orientación contraria a la línea polar. Por ejemplo, e identificando 
una transformación con su matriz asociada, se tiene 


0-10 
Px/2.e3 = 1 0 0 
0 0 1 


Teorema 5.14 Toda isometría de S? que preserva orientación es una rotación. 


Demostración. Sea f : S? — S? una isometría que preserva orientación. Tenemos 
que encontrar un punto fijo de f, es decir, un punto u tal que f (u) = u, y con eso 
habremos terminado; pues entonces manda su línea polar orientada en sí misma y el 
ángulo de la rotación queda determinado ahí. 

Sea x cualquier punto de S?. Podemos suponer que f (x) 4 x 
pues si no ya acabamos. Consideremos el segmento (orientado) 
de xa f (x) y volvamos a aplicarle la función f: va a dar a un seg- 
mento de f (x) a f? (x) que mide lo mismo. Consideremos ahora 
las mediatrices de estos dos segmentos en la dirección positiva 
y sea u su primer punto de intersección. Como f preserva ori- 
entación, por construcción se tiene que f (u) = u (el triángulo 
isósceles x,f (x) , u tiene que ir al f (x),F? (x) ,u). 

Nótese que la construcción es básicamente igual a la euclidiana, donde el caso en 
que las mediatrices no se intersectan corresponde a la translación. En la esfera como 
siempre se intersectan no hay esta excepción. Pero hicimos una trampa (no esencial), 
o bien nos falta analizar el caso en que las dos mediatrices son la misma recta (y 
el punto u no queda bien definido). Hay dos posibilidades: que el punto medio del 
segmento regrese a su lugar, y éste es el punto fijo de una rotación de 7t; o bien que 
los dos puntos medios sean distintos y generen a la mediatriz común, en cuyo caso el 
punto medio del segmento que los une es el punto medio de una rotación de Tr. O 


La composición de dos rotaciones vuelve a ser una rotación, en dónde y de a cuánto 
nos lo dice el siguiente lema cuya idea es la misma del final de la Sección 3.8.1 sobre 
rotaciones euclidianas. La diferencia es que ahora los ángulos no se suman, pero sí se 
pueden obtener geométricamente. 


Lema 5.15 Si tenemos un triángulo A, b, € con ángulos internos orien- a 
tados correspondientes , (3, y, entonces EN 


y MN As 


P2a,a “ Pag» — P-2yc- 
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Demostración. 

Sea f = P2a,a 0 P2gp- Consideremos el reflejado del trián- Á 
gulo en el lado ab y sea c' su nuevo vértice. Como d(b, e) = 
d (b, c') se tiene por construcción que Pg y (€) = €”, y análoga- SÓ 

NN». NAS —A BIN, N 
mente que P2x,a [C') = C; entonces e =f (c) es el centro de la A R 
rotación f. 

Consideremos ahora el reflejado del triángulo en el lado ac y sea b' 
su nuevo vértice. Como pp, fija a b y d(a,b) =d (a, b”), se tiene que 
f(D) = P20,02P28 0 (0) = Pza a (b) = b'. Entonces el ángulo de la rotación 
f es el ángulo dirigido Zbeb' = —2y. Lo cual completa la demostración 
del lema. O 


EJERCICIO 5.34 Demuestra que si ds (u, v) = 711/2 entonces 


Priv 2 Pu — Pruxv: 
EJERCICIO 5.35 ¿Cuál es la matriz asociada a la rotación de 271/3 en el punto 
1/43(1,1,1)?. Demuestra que es Px/2,e2 “ Pr/2,e,- Observa que en las rotaciones de la 
esfera los ángulos de rotación no se suman al componer. 


EJERCICIO 5.36 Demuestra que si una rotación manda a algún punto u en su antípoda 
entonces es una rotación de ángulo 71 con centro en un punto de u-. Y más en general: 


EJERCICIO 5.37 Demuestra que si f es una rotación de ángulo a entonces 


A = max (ds (x,f (x)) | x € s?) ] 


5.3.2 Pasos 


Como corolario al teorema del gol, obtendremos que las isometrías de la esfera que 
invierten orientación siempre son pasos (reflejar en una línea y luego trasladar a lo 
largo de ella). El ingrediente nuevo que usaremos es la existencia de una isometría 
distinguida que invierte orientación. Es la función antípoda, que denotaremos con 


a = Ss 
a(x) =-—x. 


Puesto que su matriz asociada es —I, efectivamente invierte orientación y además 
conmuta con cualquier isometría pues éstas son lineales y la antípoda consiste en 
multiplicar por —1. 


Teorema 5.16 Toda isometría de S? que invierte orientación es un paso. 


checar signo 
comp de ec. 


...Dibujo 
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Demostración. Sea f : S? — S? una isometría que invierte orientación. Tenemos 
que aof =fo a preserva orientación y por el Teorema del Gol (5.14) es una rotación 
en algún punto, u digamos. Como ao a = idsg. entonces f = ao (aof) cumple 
que f (u) = —u (pues (a of) (u) = u); es decir, f permuta los puntos antípodas u 
y —u. Entonces f deja invariante a la línea polar a u, es decir f (u-) = u- (pues 
está formada de los puntos a distancia 711/2 de Uu y —u); pero además f preserva la 
orientación de u* pues si la invirtiera, como ya manda a u en —u, preservaría la 
orientación de la esfera. Entonces f restringida a la línea u* es una rotación (una 
traslación del círculo). Por lo tanto, f es un paso a lo largo de la línea u”. Ol 


Aunque ya quedó demostrado el teorema, vale la pena recapitular en su demostra- 
ción. Si la rotación a o f en el punto u es de un ángulo a, entonces f, que se obtiene 
aplicándole la antipoda a esta rotación, vuelve a rotar un ángulo Ta la línea u+, pues 
la función antípoda en un círculo cualquiera consiste en rotarlo 71. Entonces el paso f 
es de tamaño TT + 0; cuando x = TT el paso es de 0 (= 271), o sea f es una reflexión, y 
cuando x =0 (ao f = idgz) entonces el paso es de TT y f = a. Así como la identidad 
es la rotación de 0 alrededor de cualquier punto, resulta que la función antípoda es 
el paso de 7t en cualquier línea. 


EJERCICIO 5.38 Demuestra que la composición de dos reflexiones en líneas con un 
ángulo ax es una rotación en la intersección de un ángulo 2a. Concluye que toda isometría 
puede escribirse como una composición de tres reflexiones a lo más. 


EJERCICIO 5.39 Demuestra que la composición de tres reflexiones en líneas mutua- 
mente ortogonales es la función antípoda. 


EJERCICIO 5.40 Demuestra que para cualquier A € O(3) existen B € O(3) y a € 
[0, 271] tales que 
cosx —senax 0 
BAB' =| sena cosa 0 
0 0 +1 


5.4 *Simetría esférica 


En esta sección estudiamos las posibles simetrías de los cuerpos en el espacio. Como 
en el plano, a cualquier cuerpo (o figura tridimensional) F € R3 le podemos asociar 
un grupo de isometrías que consiste de todas sus simetrías 


Sim (F) = [f € Iso(R*) | f (F) =F). 


Por ejemplo, un trompo T tiene simetría rotacional, lo que quiere decir que Sim (T) es Dibujos 


d 


una copia de O (2) (y estrictamente O (2) si ponemos a su eje de simetría en el eje z); un trompo 


diábol 


Dibujos... 
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tiene las simetrías de un círculo y cualquiera de sus tajadas perpendiculares al eje es 
un círculo centrado en él. Eso es lo que hace interesantes sus propiedades mecánicas: 
el trompo es (idealmente) indistinguible de cualquiera de sus rotaciones. Su grupo de 
simetrías puede crecer si tuviera un plano de simetría donde lo de abajo es “igual” 
a lo de arriba (un diábolo o un platillo volador, por ejemplo); entonces todos los 
pasos (la reflexión seguida de rotaciones) en este plano se vuelven automáticamente 
simetrías y además aparecen rotaciones de TT en ejes de este plano (estamos hablando 
de las matrices que aparecen en el último ejercicio y las que tienen una reflexión en 
la esquina). No es difícil intuir que si el cuerpo tiene alguna simetría extra (que 
necesariamente mueve a su eje, porque las anteriores son todas las que lo dejan en 
su lugar), entonces su grupo de simetrías crece de golpe hasta generar todo O (3) 
y estamos hablando entonces de una bola, un balín, una pelota, o bien la esfera 
S?. Estos son los posibles grupos de simetrías continuos; en el resto de la sección 
estudiaremos los finitos. 

Nótese que si G es un subgrupo finito de isometrías de IR*, entonces la misma 
demostración que dimos para el plano en el Paso 1 del Teorema de Leonardo (Sección 
3.9, Teorema 3.26) prueba que tiene un centro de simetría (el centro de masas del 
cuerpo) que podemos asumir que es el origen. Entonces es equivalente pensar que 
G está actuando en la esfera S? y hacer ahí nuestros razonamientos; podemos pen- 
sar bidimensionalmente y que estamos hablando de las simetrías de alguna figura F 
dibujada en la esfera. Así lo haremos. 

Sea G CO(3) un subgrupo finito. Queremos ver quién puede ser G. Como en el 
plano, G tiene asociados ciertos puntos distinguidos o singulares y con base en ellos 
detectaremos las posibilidades de G. Dado un punto cualquiera x € S? tenemos un 
subgrupo de G llamado su estabilizador 


Ste (x) :=1[g EG | g(x) =x), 


formado por los elementos de G que dejan fijo a Xx; y diremos que x es singular 
(para G) si su estabilizador es no trivial. Cualquier punto tiene la identidad en su 
estabilizador, pero si tiene algo más entonces es singular. 

Para cualquier punto singular (de G), v € S?, su estabilizador es cíclico o diédrico. 
Pues si g € Ste (v) entonces g (pensado como transformación de R*) manda al plano 
ortogonal a v (y al tangente a la esfera por v) en sí mismo, y entonces podemos 
pensar que St (v) es un grupo finito de isometrías del plano y por el Teorema de 
Leonardo es cíclico o diédrico. Si Stg (v) es cíclico de orden n, diremos que v es 
un centro de simetría rotacional de orden n; y si es el diédrico de orden n, que es 
un centro de simetría caleidoscópica de orden mn. En el primer caso, Stg (v) está 
generado por la rotación en v de ángulo 211/n, y en el segundo Stg (v) está generado 
por dos reflexiones cuyas líneas espejo se intersectan en v con ángulo 1/n. 

A cualquier punto x € S? también podemos asociarle un subconjunto de S? lla- 
mado su órbita 


Gx:=([f (x)|f € G), 
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que consta de todas las imágenes de x bajo los elementos de G. Demostraremos a 
continuación que la órbita de un punto consta de puntos del mismo tipo, es decir, que 
si x es un centro de simetría rotacional (o caleidoscópica) de orden n, entonces los 
puntos de su órbita también lo son. El truco es la vieja conocida conjugación. 

Si f € G es tal que f(x) = y (si y está en la órbita de x), entonces la función 
“conjugar por f” definida por 


Kk:G>6 
xs (g)=fogof 


manda al estabilizador de y en el de x. Pues si g € St (y), por definición g (y) = y, 
y por tanto 


(Fo gof) (x) = (Fo g) (f(x) =F" (g(y) =f" (y) =x, 
lo cual implica que kf (g) € Ste (x). Es fácil ver que conjugar por f es una biyección 


(su inverso es conjugar por f”!) y que preserva el producto del grupo (k+ (go g') = 
Ks (9) o kf (9/)), así que Sté (y) y Sté (x) son isomorfos (el mismo tipo de grupo). 


EJERCICIO 5.41 Con la notación de arriba, demuestra que 
1 (G) =$ (Gx) $ (Sto (x)). 


Donde f significa “cardinalidad”, es decir, número de elementos de un conjunto. 


5.4.1 Subgrupos finitos de SO (3) 


Consideremos primero el caso en que el subgrupo finito de isometrías de la esfera, 
G, preserva orientación; es decir, que todos sus elementos lo hacen, o, dicho de otra, 
manera, que G € SO (3). Supongamos que G no es trivial, entonces tiene algún 
elemento f que no es la identidad. Por el Teorema 5.14, f es una rotación en un punto 
v, y entonces v es un punto singular para G, pues f(v) = v y f % idsz. El estudio 
de estos puntos singulares nos llevará a determinar G. 

Ya vimos que G tiene algún punto singular v. Éste es un centro de simetría 
rotacional de orden n, digamos, y entonces Stg (v) es un grupo cíclico generado por 
la rotación en v de ángulo 271/n, que llamaremos f de aquí en adelante. La primera 
posibilidad es que G = Stg (v), es decir que G sea un grupo cíclico de orden n, 
cuyo único otro punto singular es —v; G consiste de rotaciones en el eje (v, —v). Si 
no es éste el caso, cualquier elemento de G — Ste (v) 4 Y mueve a v. 
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Supongamos entonces que la órbita de v tiene algún punto distinto de v. Como 
G v es finito podemos escoger v' € Gv tal que v % v” y que su distancia a v sea míni- 
ma. Por la demostración del Teorema del Gol (5.14), los centros de las rotaciones que 
mandan a v en v' estan en su mediatriz, € digamos; y como en G tenemos rotaciones 
que mandan a v en v', en € tenemos a sus correspondientes centros: sea u el más 
cercano de estos a v. Entonces u es el centro de una rotación g € G tal 
que g (v) = v". u 


Como u es punto singular de G entonces su estabilizador es cíclico, de 
orden m digamos. Afirmamos que g es su generador de ángulo + (21/m). Y ñ 
Si g no fuera este generador de St¿ (u), entonces tendríamos que en 
St (u) hay una rotación g' de ángulo estrictamente menor que el de g 
(un divisor) y ésta mandaría a v en un punto más cercano que v' contradiciendo la 
forma en que escogimos a v'. Así que g es la rotación en u de ángulo + (211/m); 
supongamos sin pérdida de generalidad (habría que cambiar v por v” si no) que es 
2n/m. Tenemos entonces que el ángulo de la línea uv a € es 1/m. 


Sea w el punto en é,, tal que el triángulo T = (u, v, w) tiene ángulos 
internos 1/m y 1/n en u y v respectivamente; y sea y el ángulo (dirigido) 
de T en w. Por el Lema 5.15, g of es una rotación con centro en w y 
ángulo —2y, que manda entonces a v en v'. Como gof € G, se tiene que 
w es punto singular de G, y gof es generador de St¿ (w) por la misma 
razón que g es generador de St (v) (que sólo usó cómo escogimos v/). 
Tenemos entonces que gof es una rotación en w de un ángulo + (271/k), 
donde k es el orden de St (w). 


Pero necesitamos demostrar aún más: que y = TT1/k; y para esto hay que usar 
cómo escogimos u. Hasta ahora sólo sabemos que 2y, como ángulo, es + (2711/k); y 
esto también es cierto si y = TT +M/k. Pero observemos que conforme un punto Xx 
en la mediatriz € se aleja de v, partiendo del punto medio, el ángulo de la rotación 
con centro en x que lleva a v en v' decrece en valor absoluto; así que 71 /m > y pues 
u fue escogido como el más cercano a v, es decir ds: (U,v) > dez (w,v). Con este 
ingrediente extra, se puede concluir que y = T/k. 


Ahora sí, hemos encontrado un triángulo T cuyos vértices son centros de simetría 
rotacional de G de orden k, m, n y con ángulos internos correspondientes 1/k, 1/m, 1/n. 
La clasificación de los grupos G que nos faltan depende de cuáles triángulos de estos 

existen. 


¡De Por el Teorema 5.10 (de la suma de ángulos de un triángulo esférico), 
se tiene que k, m, n (los tres enteros mayores que 1) deben cumplir 


11 
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donde hemos factorizado y anulado a 7Tt. Si suponemos que k < m < 
n, es fácil ver que las únicas soluciones de esta ecuación son, en orden 
lexicográfico, 


A(N/r | | 1G 
Zn 
12 (5.9) 
24 
60 


donde se ha añadido la columna de exceso sobre 1 en (5.8), que, por el Teorema 
5.10, multiplicada por 7Tt nos da el área del triángulo; y otra columna adicional donde, 
adelantándonos, ponemos la cardinalidad del grupo G de donde salió el triángulo, y 
que, como veremos, corresponde a A (S?) /24 (T). 

Hemos demostrado la parte de “unicidad” de un teorema —“si G C SO (3) es 
finito entonces cumple tal cosa”— y nos falta la de “existencia”: ver que tales grupos 
existen. Pero antes de hacerlo vale un comentario sobre el final de nuestra argu- 
mentación previa. En el “es fácil ver que las únicas soluciones...” el argumento es que 
en la asignación que (lexicograficamente) sigue, la 2, 3, 6, se obtiene la igualdad con 1 
(en la desigualdad (5.8)); las otras dos igualdades con 1 son la 2,4,4 y la 3,3, 3; para 
el resto de los valores de k < m < n, la suma de sus inversos es menor que 1. Las 
tres igualdades con 1 dan lugar a triángulos euclidianos y a tres grupos cristalográfi- 
cos ahí, que son precisamente los subgrupos orientados (de isometrías que preservan 
orientación) de los tres grupos caleidoscópicos Ké32, K442 y K333 que vimos en la 
Sección 3.9.2 (Teorema 3.27; de hecho, su demostración fué con la misma idea de 
encontrar un triángulo “racional”). El resto de las asignaciones, k < m < n cuyos 
inversos suman menos que 1, daran lugar a subgrupos discretos del plano hiperbólico 
que veremos al final del capítulo 8; todos juntos son los llamados grupos triangulares. 

Ahora sí, veamos la existencia de los grupos finitos G € SO (3) que, en abstracto, 
dieron lugar a la tabla (5.9). Para el primero, 22n (léase “dos-dos-ene”), pensemos 
en una pelota playera partida en n gajos iguales (angularmente de tamaño 211/n) con 
la válvula, donde confluyen los gajos, en el polo norte. Ahí está el centro de simetría 
rotacional de orden n. Los de orden 2 están todos en el ecuador. Una órbita en su 
intersección con las costuras y la otra en los puntos medios de los gajos. Al rotar TT 
en uno de los primeros, un gajo se intercambia con el de junto y los polos también; 
al rotar 71 en uno de los de enmedio, su gajo intercambia hemisferios. Si pensamos 
en el plano del ecuador, éste siempre regresa a su lugar y aunque en R* hayan sido 
rotaciones, las de orden 2 son reflexiones en él. Ese plano “cree” que el que actúa 
es el grupo diédrico de orden n, y efectivamente, este grupo es isomorfo a D,, pero 
realizado con rotaciones en R*. 

Pasemos a exhibir al grupo 235, pues, esféricamente, es el que más manoseamos 
en estas épocas. Es el grupo de las simetrías orientadas del balón de fútbol: los 
movimientos (reales, físicos) que dejan su estructura de gajitos pentagonales y hexa- 


Dibujo... 


Dibujo... 


Dibujos... 
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gonales en su lugar (abstrayéndonos de la válvula y los letreros). El centro de simetría 
rotacional de orden 5, que, para fijar ideas, podemos suponer que es el tal v con el que 
arrancamos la demostración, es el centro de un pentágono: rotar 271/5 ahí, claramente, 
preserva la estructura. Como centro de orden 3 (que ha de ser w) tomemos el centro 
de un hexagonito adyacente y obsérvese que su simetría es de orden 3 (no 6) pues a su 
alrededor alternan tres pentágonos y tres hexágonos. El de orden 2 (que apareció como 
u en la demostración) es entonces el punto medio de la costura entre el hexagonito 
escogido y un hexágono adyacente (también pegado al pentágono de v); al rotar T 
ahí, se voltea la costura, se intercambian sus dos hexágonos y el pentágono original 
pasa al opuesto siguiendo la costura, cuyo centro es el tal v'. 

Es claro entonces que las órbitas de los tres tipos de puntos singulares son los 
centros de los pentágonos (orden 5) que hay 12, los de los hexágonos (orden 3) que 
hay 20 y los de las costuras entre estos (orden 2) que hay 30; y de cualquiera de ellos 
se obtiene que el grupo tiene 60 elementos. Obsérvese también que en la demostración 
pudimos haber empezado con cualquiera de las órbitas y haber llegado al mismo tipo 
de triángulo T, pero el punto auxiliar v”, dependiendo de cómo fue que arrancamos, 
hubiera sido el nuevo que se obtiene al reflejar a T en sus tres lados (¿en qué orden 
hubieran aparecido los puntos en la demostración de haber empezado con uno de orden 
3 0 2?). Al mover el cuadrilátero que forman T junto con alguno de sus reflejados 
por el grupo, se cubre toda la esfera sin traslapes (salvo en aristas o vértices), de 
aquí la relación entre las dos últimas columnas de la tabla. En fin, la existencia del 
grupo 235, la demuestra cualquier balón de fútbol aunque clásicamente se usan como 
referencia el dodecaedro y el icosaedro. 

El dodecaedro tiene como vértices los centros de simetría de orden 3; se obtiene 
de ellos tomando su casco convexo: todo lo que atrapan o está entre ellos y que 
formalmente se define como el conjunto de todas sus posibles combinaciones afines 
con coeficientes positivos. Su frontera está formada de doce (y de ahí el nombre) 
caras pentagonales que se juntan de a tres por vértice. Análogamente, o de manera 
dual, el ¿cosaedro es el casco convexo de los centros de simetría de orden 5, que queda 
formado por caras triangulares de a cinco por vértice. En ambos casos, los centros de 
simetría de orden 2 están en los puntos medios de las aristas. 

El grupo 234 es el de las simetrías orientadas del cubo (del dado borrado o, 
esféricamente, del balón de vólibol), cuyo dual, con el que comparte el grupo, es 
el octaedro (ocho triángulos de a cuatro por vértice). Por último, el 233 es el del 
tetraedro (cuatro triángulos equilateros pegados) que es autodual. Obsérvese que en 
este grupo, aunque sólo hay puntos singulares de orden 2 y 3, estos últimos se dividen 
en dos órbitas que corresponden a los cuatro vértices y a los centros de las caras. 

Habiendo expuesto los posibles grupos, podemos resumir. 


Teorema 5.17 Los subgrupos finitos de SO(3) son los cíclicos C,, los diédricos 
orientados D,, (generados por dos medias vueltas) y los tres grupos de simetrías ori- 
entadas de los sólidos platónicos. Ol 
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EJERCICIO 5.42 ¿Cuál es el grupo de simetrías orientadas de la pelota de tenis? 


5.4.2 Subgrupos finitos no orientados 


Veremos ahora qué posibilidades tiene G € O (3) finito si además tiene algún elemento 
que invierte orientación (y por lo tanto la mitad de ellos lo hacen). 

Consideremos primero el caso general de un paso p en una línea €. ¿Qué genera” 
Si p está dentro de un grupo finito, al considerar su acción dentro de la línea €, que 
es un círculo, p genera ahí un grupo cíclico y podemos suponer que entonces tiene un 
ángulo 2711/n (si no, lo cambiamos por su potencia que sí lo tiene). Para fijar ideas y 
tener una figura geométrica en mente, supongamos que € es el ecuador y tomemos un 
punto vy en el hemisferio norte (distinto del polo); p (vo) =: v; queda en el hemisferio 
sur. Si tomamos el segmento de vy a v; y le aplicamos p, nos queda un segmento que 
sale de v¡, vuelve a cruzar el ecuador hacia el norte y llega a v, := p (v¡) = p? (vo), 
y podemos seguir generando un zigzag con v; := pi (v)) que “zurce” el ecuador con 
segmentos de v; a Vi¡,1. Es un polígono espacial o esférico que llamaremos Z,, “el 
zigzag-N”. 

Hay de dos sopas, si n es impar, v, queda en el hemisferio sur; pues p” regresa 
al círculo €, a su lugar pero refleja sus dos lados, es justo la reflexión en €, ya que 
al componer un número impar de transformaciones que invierten orientación, ésta se 
invierte. Por la misma razón, si n es par, entonces p” = id, Vy = V, y P genera un 

grupo cíclico de orden n que tiene como únicos puntos singulares a los 

polos y en ellos el estabilizador es cíclico de orden n/2 (con generador 

p?), pues sólo en las composiciones pares estos puntos regresan a su 

) lugar (lo que corresponde a que los v; con i par están en el hemisferio 

norte.) Volviendo al caso en que n es impar (y entonces p” es la 

NA reflexión en €, y v, el reflejado de vo), hay que dar una segunda vuelta 
para que vo y también toda la esfera regrese a su 
lugar, p?” = id. En este caso, p genera un grupo 
cíclico de orden 2n que también tiene dos puntos singulares 


(los polos) con estabilizador de la mitad (C, con generador de 
ángulo mínimo p”*!), pero que además tiene puntos singulares EX VÍAS 
en todo €, que llamaremos un espejo, cuyo estabilizador es la TA 
reflexión p” (junto con id, por supuesto). Podemos resumir que N 
los grupos finitos generados por un paso siempre son cíclicos de 
orden par, pero que ellos aparecen de dos formas distinguibles por la configuración 
de sus puntos singulares. 

Hay una excepción en lo que hemos dicho; para n = 1,2 no aparecen los centros 


de simetría rotacional en los polos. Para n = 1 tenemos una simple reflexión, y para 
n =2, pes la función antípoda a que no tiene puntos ni rectas distinguidas: todos 


...Dibujo,Zn 
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sus estabilizadores son triviales (dícese que el grupo (id, a) “actúa libremente” en S?); 
£ sólo sirvió de apoyo pero a ella no la distingue el grupo. 


Para n > 2, el zigzag-n, Z,, es un ciclo o polígono combinatorio (de longitud 
n para n par y de longitud 2n para n impar), donde p actúa como su rotación ge- 
neradora. Podemos agrandar al grupo (p) (el generado por p) para que tenga todas 
las posibles simetrías combinatorias del polígono Z,,, si le adjuntamos la reflexión o 
en la línea perpendicular a €, que pasa por Vo, y que combinatoriamente corresponde 
a la reflexión en el vértice básico. Entonces el grupo crece a un diédrico, donde, así 
como unas “rotaciones combinatorias” invertían orientación en la esfera (los pasos), 
las “reflexiones combinatorias” en las aristas son ahora rotaciones de 7t en las inter- 
secciones de las aristas con el ecuador (la que “refleja” en el centro de la primera 
arista es 0 o p”!). Pero de nuevo, la configuración de puntos singulares distingue es- 
tos dos diédricos. Para n par, tenemos dos centros caleidoscópicos (con estabilizador 
diédrico) de orden n/2 en los polos junto con los n/2 espejos entre ellos y otros n/2 
puntos de simetría rotacional de orden 2 en el ecuador (donde se intersectan las aris- 
tas de Z, al ecuador y justo a medio camino entre los espejos). Pero para n impar, 
como ya teníamos un espejo en el ecuador, junto con las nuevas rotaciones de 7 ahí, 
se producen n centros caleidoscópicos de orden 2 (una órbita en los cruces dobles de 
aristas de Z, y la otra entre pares de vértices opuestos de Z,). 


Nos falta describir los grupos caleidoscópicos: finitos y generados por reflexiones. 
Los generados por dos reflexiones son diédricos (que ya aparecieron como subgrupos 
estabilizadores) y que esencialmente vienen de una dimensión inferior. Pero tenemos 
además los generados por tres reflexiones con espejos en los lados de un triángulo 
T “racional” con ángulos 1/k,71/m, 11 /n como en la Tabla 5.9 cuyo subgrupo que 
preserva orientación, es uno de los que ya estudiamos. Su configuración de puntos 
singulares es la misma que la de sus grupos de orientación, pero el estabilizador en 
cada punto se vuelve diédrico en vez de cíclico; y hay que añadir todos los espejos 
que parten a S? en triangulitos equivalentes a T, tantos como elementos del grupo y 
justo el doble de lo indicado en la tabla. Obsérvese que de los primeros, la familia 
22n, los de n impar ya aparecieron como otra representación de los diédricos; pero 
para n par son nuevos. 


Los tres que nos quedan son los grupos de simetrías de los sólidos platónicos; 
llamémoslos K233, K234 y K235 que corresponden al tetraedro, al cubo (y octaedro) 
y al dodecaedro (e icosaedro). Se pueden obtener físicamente al poner tres espejos 
en los ángulos adecuados (claro, hay que cortar los espejos con cuidado y sabiendo 
cómo, pues los vidrios no son tan fáciles de mover e intersectar como nuestros planos 
abstractos en R*). Para obtener estos tres planos se toman un vértice vo, el punto 
medio de una arista incidente v; y el centro, vz, de una de las dos caras de la arista; los 
planos que estos puntos generan por parejas junto con el origen (el baricentro del solido 
platónico en cuestión) son los tres planos espejo del caleidoscopio correspondiente. Al 
asomarse a él se multiplica nuestra imagen, una por cada elemento del grupo, y viendo 
cada una a través de su triangulito. En la siguiente sección veremos con más cuidado 
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cómo obtener estos puntos. 

Hemos dado cuenta de todos los posibles grupos finitos de O (3). Falta demostrar 
que no hay más, la unicidad, pero lo dejamos como un posible trabajo o ejercicio 
avanzado. 


EJERCICIO 5.43 ¿Cuáles son los subgrupos de orientación de Sim (Zn)? 


EJERCICIO 5.44 ¿Cuántas reflexiones hay en K>233 y cuántos pasos de qué ángulos? 
¿Y en K>234? 


5.4.3 Los grupos platónicos 


En esta sección estudiamos con más cuidado los grupos de simetrías de los poliedros 
platónicos y damos representaciones explícitas de ellos. 

Usando la notación introducida por Schláfli para poliedros regulares en el siglo 
XIX, denotemos por ([m, n) al poliedro platónico con m ágonos regulares por caras 
y con n de ellas en cada vértice.! Así fm, n) puede ser (3,3), (3,4), (4,3), (3,5) 
o (5,3) (tetraedro, octaedro, cubo, icosaedro, dodecaedro). Como en la sección an- 
terior, llamemos vy,V¡,V2 respectivamente a un vértice, el punto medio de una arista 
y el centro de una cara incidentes. Pensemos además que ((m, n)) está centrado en 
el origen, y sea u; el punto en S? en la dirección v;, 1.e., u; := (1/[v,)) v;. Entonces 
los ángulos internos del triángulo esférico T con vértices u¿,u¡,uz tiene ángulos re- 
spectivos 1/n, 711/2, T/m. Si llamamos p; a la reflexión en el lado de T opuesto a u;, 
entonces p, cumple que p, (u;) =u; $ 174) (sólo mueve a u;). Pero además, como 
son reflexiones y puesto que p;,py es la rotación generadora de la cara, p,p, es la del 
vértice y PPp es la media vuelta en la arista, se tiene que cumplen las relaciones de 
Coxeter: 


p? = 1 para i=0,1,2 
(pp) = (pp) = (pp) =1, (5.10) 


donde entendemos por 1 a la identidad. Estas relaciones son importantes pues, en 
abstracto, definen por completo al grupo; se dice que dan una presentación de él 
por generadores y relaciones. No lo demostraremos, pero nótese que el análogo en 
dimensión 2 de los poliedros platónicos son los polígonos regulares. Si llamamos (m 
al de m lados, su grupo de simetrías está generado por dos reflexiones, Py y P1, que 
cumplen las relaciones 
po =p i= (p1P0)”" =1. 

Que esto define en abstracto el grupo diédrico D.,, es porque al considerar Py y Py 
como letras y tomando en cuenta la equivalencia que determinan estas relaciones, 


lUsaremos dobles corchetes para que no se confundan con conjuntos, aunque originalmente 
Schláfli usaba sólo uno. 


...Dibujos 
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las palabras en Po, Py y sus inversos corresponden a los elementos de D,,; cualquier 
palabra es equivalente (usando las sustituciones adecuadas en subpalabras) a una de 
tamaño chico y en la que se alternan las letras. No entramos en detalles, sólo queremos 
indicar que se abren puertas a generalizaciones naturales a más dimensiones y lo 


Dibujo...(cubo) dejamos como motivación para un curso de álgebra y el estudio abstracto de grupos. 


dibujo 
pirámide 


Lo que sí haremos es dar una representación explícita con matrices, es decir, 
dando una posición fija al poliedro (m,n) en ¡R3 y fijando las coordenadas de la 
terna básica Vy, V], V2; estas reflexiones se expresarán como matrices que cumplen las 
seis relaciones de Coxeter (5.10). 


Empecemos con el cubo ((4,3). Sus coordenadas más elegantes se obtienen al 
tomar como vértices los ocho puntos de coordenadas (+1,+1,-+1); y entonces es un 
cubo paralelo a los ejes y con arista de tamaño 2. Si tomamos como terna básica 
v =(1,1,1), v, = (1,0,1), vz = (0,0, 1), entonces la representación del grupo de 
simetrías del cubo, que habíamos llamado K234, queda determinada por las matrices 


lo 0.0 010 0 0 1 
P>|0 10]; pa|100]; pap» 010 
0 0 1 0.0 1 00 


Se tiene entonces que p¡py es la rotación de 71/2 en el eje z, y que pp] es la matriz 
que permuta a la base canónica cíclicamente e; + e, + e3 > ej. Por lo que hemos 
visto, todas las multiplicaciones posibles de estas tres matrices dan 48 (cada columna 
y cada renglon con dos ceros y un +1) y son todas las simetrías del cubo. 


El tetraedro, que conviene verlo inscrito en este cubo, se deja como ejercicio. Es 
más arduo establecer las coordenadas del dodecaedro ((5,3. Conviene verlo directo 
hacia una arista; se ven entonces sólo cuatro caras, las dos pe- 

gadas por la arista y las dos “opuestas” a ella en sus vértices. 


PS Otras cuatro caras quedan de canto y las cuatro restantes atrás. 


tipografía <—<X> 


Se observa entonces que los cuatro vértices que rodean a nuestra 
arista forman un cuadrado cuyo lado es la diagonal del pentá- 
gono, y que este cuadrado se completa hacia atrás para formar 
un cubo. Los vértices de este cubo son vértices del dodecaedro 
(se dice que está inscrito) y sus aristas son diagonales de las 
caras pentagonales, quedando cada cara del dodecaedro con una 
diagonal distinguida. 
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Tenemos que hacer un paréntesis y ver que la diagonal de un pentágono regular 
está en proporción áurea con su lado. Para esto, tomemos el triángulo isósceles en que 
corta una diagonal al pentágono. Éste es el isósceles áureo chaparro. Es fácil 
ver que sus ángulos miden 71/5, 71/5 y 311/5. Entonces al tomar un triangulito 
semejante con su base en el lado chico, lo que queda vuelve a ser isósceles, 
pues sus ángulos son 2711/5, 271/5 y Tt/5: es el áureo alto. De aquí se sigue que 
sabemos cuánto mide el lado pequeño del semejante. Si el lado del pentágono 


mide 1, su diagonal H debe cumplir por semejanza de triángulos que 


La solución positiva de esta ecuación es la proporción áurea (veéase Sección 3.9.3) 


== bb  =p9+1 (5.11) 


Cosideremos entonces un dodecaedro con arista de tamaño 
2, de tal manera que ocho de sus vértices queden en los del 
cubo estándar de lado 24 —es decir, son los ocho puntos 
(+0, +0, +Q)—; para acabar de determinarlo hacemos que 
la arista por la que lo atraviesa —en su punto medio— el 
eje x esté en dirección del eje y. El dodecaedro se obtiene 
de este cubo pegándole adecuadamente una palapita en cada 
cara. El techo de cada palapa está hecho de dos triángulos y 
dos cuadriláteros y se ajustan los unos de una con los otros de 
otra para formar las caras pentagonales. Nos falta determinar 
la altura de la palapa que deberíamos llamar áurea. 


Para esto, obsérvese que en la proyección ortogonal del dodecaedro 


al plano yz se ven los planos de la planta y las dos fachadas de la 
palapa áurea, y entonces la altura aparece en dos triángulos semejantes 
como sus dos catetos; los otros catetos los conocemos, son « arriba, y 
$ —1=q" al lado. Por (5.11) la altura tiene que ser 1. De aquí 
que el punto medio de la arista más cercana a nosotros es (q?,0,0), 
de nuevo por (5.11), y los 12 vértices que nos faltan son HEOS +1,0), 


(0,28*,El) y (1,0, 50). 
Si tomamos como triángulo básico vy = (q?,1,0), v, = (q?,0,0) y vz como el 
centro de la cara superior (no necesitaremos sus coordenadas), entonces dos de las 
reflexiones son muy fáciles: 


l 0 0 10.0 
P>|0-10]; pa|po1.0 
O 0 1 0 0 —1 
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Para encontrar p¡, podemos ver a dónde tienen que ir los tres vectores canónicos 
e:, €2, €3, que no es difícil, pues en sus direcciones quedaron puntos medios de aristas. 
Por ejemplo, v¡ tiene que ir bajo p;, a 


y (0 p* ¡(9 ¡(9 
7 e ]+1 1 pP=3| e ]=3/1 4], 
b 0 b b 


cuya norma es q? (esto se ve usando repetidamente la ecuación 
áurea (5.11) que implica $” = $? + y”? y que nos permite 
bajar los grados de las expresiones). Entonces, normalizando, la 
primera columna de la matriz debe ser (1/2) (p,1, p”*). Análogamente se enc 
las imágenes de €, y ez para obtener 


] 
p > 2 1 pl — 
9? —y 1 


EJERCICIO 5.45 Encuentra las simetrías del tetraedro 


Para leer más sobre poliedros y otros puntos de vista ver [4], [11] y [10]. 


Capítulo 6 


Geometría proyectiva 


6.1 Motivación 


Formalmente hablando, Desargues descubrió la geometría proyectiva; fundamentó 
matemáticamente los métodos de la perspectiva que habían desarrollado los artistas 
del renacimiento. Pero su trabajo, publicado en 1639, pasó desapercibido por 200 años 
(a excepción de dos teoremas famosos que se publicaron en otro lado). Quizá está 
desatención histórica se deba a que su contemporaneo Descartes se llevó las palmas. 
No es sino hasta el siglo XIX, cuando la geometría proyectiva, así como la hiperbólica, 
se establecieron como algo real, ineludible y cierto dentro de las matemáticas. Pero 
este proceso no fue fácil. Había que relajar la idea de El Espacio y El Plano 
(así, con mayúsculas y negritas) como algo único y dado —“ahí vivimos, se pensaba; 
está dado por Dios, se creía desde los griegos” —, así que pluralizar la idea a “los 
espacios” y “las geometrías”, casi como pasar de un cómodo monoteísmo a un exótico 
politeísmo, requirió tiempo y argumentos más allá de la simple lógica. Quizá lo que 
acabó de enraizarlas fue encontrar un modelo analítico: dentro del mismo contexto 
de la geometría euclidiana se puede construir la proyectiva, y entonces, si se acepta 
la primera, no queda más remedio que aceptar la segunda. Y este proceso acabó con 
contundencia a principios del siglo XX. Einstein, basándose en los impresionantes 
desarrollos geométricos de los matemáticos durante el recién rebasado “siglo de las 
geometrías”, demostró que, a gran escala, el universo se modela mejor con las nuevas 
geometrías que con el viejo y rígido espacio euclidiano. 

No es nuestro interés seguir la línea de desarrollo histórico, pero sí vale la pena 
hacer una pausa para, a manera de motivación, abrir la mente a otros posibles enfo- 
ques. 


6.1.1 El quinto postulado 


Como mencionamos en las primeras páginas de este libro, el quinto postulado de 
Euclides recibió mucha atención por parte de los matemáticos de 20 siglos. Se dudaba 
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de la necesidad de incluirlo como axioma, reflejando la idea de que “El Plano” era 
único y estaba divinamente dado. Su negación tiene dos posibilidades: que no haya 
paralelismo, es decir, que cada par de rectas se intersecta en un punto; o bien, que 
el paralelismo no sea único, que por un punto fuera de una línea pasen muchas que 
no la intersectan. Al incluir la primera negación como quinto axioma se obtiene la 
geometría proyectiva; y al incluir la segunda la hiperbólica. Ahora entendemos bien 
que estos sistemas axiomáticos (el de la geometría proyectiva y el de la geometría 
hiperbólica) se dan, se construyen, en modelos basados en axiomas más elementales; 
tal y como construimos el plano y los espacios euclidianos basados en los axiomas de 
los números reales. Pero a principios del siglo XIX, que algún matemático demostrara 
teoremas basado en estos sistemas axiomáticos exóticos no implicaba que un poco más 
adelante, que a la vuelta de la esquina, no llegaría a una contradicción. Era trabajo 
de alto riesgo, cuestión de creer o no creer, y los “exóticos” ganaron la partida. 

Regresando a la teoría que en este libro hemos desarrollado, tenemos a la mano 
la evidencia (y siempre estuvo ahí) de que el Quinto se puede negar proyectivamente. 
Acabamos de hacer geometría en la esfera; definimos líneas, distancias y ángulos, y 
vimos que hay un grupo que la hace homogénea; todo esto basados en los axiomas 
de los números reales. Nótese que la esfera casi cumple con los axiomas proyectivos 
excepto por que las líneas (¡cualquier par!) se intersectan en dos puntos en vez de 
uno, pero estas parejas de intersección son muy especiales: sólo para ellas falla la 
unicidad de la línea por dos puntos. Entonces, si declaramos que cada pareja de 
antípodas es un solo punto (esta abstracción es la que cuesta trabajo), se obtiene el 
plano proyectivo rígido. Así, el plano proyectivo es algo abstracto (sus puntos 
son parejas especiales de puntos, los antípodas), y la esfera es algo concreto que 
podemos ver y que lo “cubre” dos veces. Este modelo abstracto del plano proyectivo 
cumple, ahora sí, con todos los axiomas proyectivos: las líneas siempre se intersectan 
en un solo punto (piénsese “pareja antípoda”) y por cada par de puntos (piénsese, 
par de “parejas antípodas”) pasa una única línea. Además, a este plano proyectivo lo 
podemos ver en porciones pequeñas: es igual a un pedazo chico de S?; sólo la imagen 
global se dificulta. 

Sin embargo, no seguiremos la línea de desarrollo teórico que acabamos de esbozar. 
Habremos de regresar a ella, y entonces debe ser clara y sencilla, después de desarrollar 
el plano proyectivo holgado, que tiene muchó más simetrías porque no tiene noción 
de distancia. Podría decirse que es el análogo del plano afín (holgado) respecto al 
euclidiano (rígido). Y la motivación para entrarle viene de otro par de problemas o 
evidencias. 


6.1.2 Las cónicas y el infinito 


Mucho antes del surgimiento de la geometría analítica (Descartes), los griegos estudi- 
aron las cónicas definidas como la intersección de un plano con un cono circular (¡y de 
ahí su nombre!). Ya las definimos, estudiamos y clasificamos (afín e isométricamente). 
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Aunque su definición sea única (insistimos, un cono intersectado con un plano, que 
no pasa por su ápice, precisamos), nos da tres tipos esencialmente distintos: elipses, 
parábolas e hipérbolas. Se pueden diferenciar por su comportamiento “al infinito”: 
las elipses no tienen nada que ver con él; las parábolas se aproximan a él en una 
dirección importante para su propiedad focal, y las hipérbolas llegan al infinito en 
dos direcciones dadas por sus asíntotas, y se puede decir que pasan por él dos veces. 

Más precisamente, la pendiente de las tangentes a la parábola tiende, cuando nos 
alejamos al infinito en cualquiera de sus dos direcciones, a la dirección de su eje, 
aunque la tangente tal cual se aleje al infinito. Podría 
decirse que la parábola es tangente al infinito, basta 
verla en perspectiva. Y de la hipérbola podemos de- 
cir aún más: si un punto en ella se aleja al infinito 
en cualquiera de sus cuatro posibilidades, su línea tan- 
gente, como línea, simple y plácidamente se acerca a una 
de las asíntotas y el movimiento natural de esa tangente 
es tocar a la asíntota, y seguirse como la tangente de puntos que se acercan por la 
rama opuesta. Como si la hipérbola simplemente cruzara al infinito por dos puntos 
correspondientes a sus dos asíntotas. (Véanse las animaciones del Capítulo 2 para 
sentir la naturalidad de lo que estamos diciendo.) 

Debe haber una manera natural y coherente de incluir estos “puntos al infinito” 
para que las tres cónicas se conviertan en una sola cosa (como los griegos lo intuyeron). 
Consiste en agregarle al plano afín una recta al infinito cuyos puntos están asociados 
a las posibles direcciones de las rectas; y entonces las tres cónicas se completan y 
diferencian por su relación con esa recta, o no la tocan, o son tangentes o la cruzan 
en dos puntos (lo mismo que sucede con el resto de las rectas). Lograr que esa recta 
(que parece inalcanzable pero que se ve tan clara como el horizonte) se convierta en 
una recta como cualquier otra es lo que hace el plano proyectivo. 

La técnica y la soltura matemática que se obtiene al formalizar lo anterior, permitió 
que la geometría algebraica se desarrollara en la segunda mitad del siglo XIX. Los 
inicios y la aplicación concreta a cónicas se verán en el siguiente capítulo. Por lo 
pronto, dejemos de divagar y concentrémonos en el problema que da la guía y la pauta 
del desarrollo formal de este capítulo. Además es el problema que dio su nombre a la 
geometría proyectiva y que históricamente tiene la primicia de su desarrollo. 


6.1.3 El problema del pintor 
...Dibujo: 


En el Renacimiento se fue haciendo claro que un dibujo “realista” de una escena ¡¿Reproducci 
cotidiana se logra proyectando desde un “foco” (ojo hipotético) sobre el lienzo. Es Durero? 
decir, a cada punto, x digamos, de la escena le corresponde un punto en el lienzo, A 

digamos, al tomar la recta que pasa por el foco y x e intersectarla con A. La razón 

por la que los cuadros dibujados con esta técnica nos parece “realista” es que si se 

le observa desde el foco, la imagen que se percibe es casi idéntica (en teoría idéntica 


... Dibujo 
rieles 


1] 
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viendo con un solo ojo) a la escena original. Y si vemos el cuadro desde otro punto 
cualquiera, nuestro cerebro se encarga de adaptarlo para recrear la tridimensionalidad 
que se plasmó en el lienzo. Cómo logra esto nuestra mente, es harina de otro costal, 
pero que es un hecho que sabe hacerlo, y muy bien, se demuestra observando que de 
dos imágenes planas obtenidas con el mismo principio (las imágenes que se proyectan 
en la retina) tenemos una idea muy clara del espacio tridimensional que habitamos. 
Los pintores renacentistas, entre quienes destaca Durero, desarrollaron técnicas para 
dibujar con este principio. Las llamaron “métodos de la perspectiva” e incluyen el 
uso de “puntos de fuga”. Como veremos más adelante estos puntos no son otra cosa 
que “puntos al infinito” que, al desarrollar la geometría proyectiva, se pueden tratar 
como puntos cualesquiera. 

El problema concreto con el que empezamos la discusión formal en este capítulo 
puede plantearse en este contexto; es, por así decirlo, el problema que motivo a 
Desargues pero usando los métodos de su contemporáneo Descartes. Pensemos que 
queremos dibujar, en perspectiva, una vía de tren sobre una planicie inmensa. Los dos 
rieles se dibujan como segmentos que convergen a un punto de fuga. El problema es 
cómo dibujar los durmientes. Si en la realidad estan espaciados cada metro, digamos, 
¿cada cuántos centímetros habrá que dibujarlos? Dicho de otra manera, ¿cómo cambia 
la escala al proyectar desde un punto?. Este problema, numérico y de tres a dos 
dimensiones, es el que resuelven automáticamente las computadoras en la realidad 
virtual. Veremos al final cómo lo hacen. 


6.2 La línea proyectiva 


6.2.1 Proyecciones de rectas en rectas 


Supongamos que tenemos dos rectas Ll; y l, en RR? pará- 
L, metrizadas con parametros s y t respectivamente. Sea 
p € R? un punto fuera de ellas. Podemos definir la 
proyección desde p de fl; a fl, geométricamente como 
sigue. Dado x € fl, sea fl, la recta que pasa por p y Xx; 
sea entonces 


“p:l 1,” (6.1) 
p(x) =f4 NL. 


Ésta no es una función bien definida (de ahí que 
hayamos usado comillas) pues si Xp € l; es tal que lx, 
es paralela a l, entonces l N lx, = 0 y p(xo) no tiene 
sentido. Pero este problema sólo se da en un punto, así 
que nos podemos hacer de la vista gorda y continuar. La 
pregunta que nos interesa responder es: ¿cómo se expresa 
( en términos de los parámetros s y t? 
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Veamos primero un ejemplo concreto y sencillo, donde p = 0, 


lt = ((1,1) |teR), 
lo = ((s,1)|s ER). 


Dado x = (1,t) € l;, la recta l, es [(r, rt) |r € Rj). Así que l, N l, estará dado por 
la r que cumple rt = 1, es decir r = 1/t, y por lo tanto h 


p(1,t) =(1/t, 1), 


que está bien definida excepto cuando t = 0, lo que cor- 
responde a que la recta por (1, 0) y el origen no intersecta 7 (1,9 
a l,. Pensando a (qp como función entre los parámetros, b, > 


tenemos entonces 


donde el entrecomillado significa que hemos abusado de 
la notación. Para hacer esto más preciso, y de una vez más general, notemos primero 
que la proyección desde un punto a una recta se puede extender a casi todo el plano. 


Fijando una recta l y un punto p fuera de ella, podemos definir para x € R?, a 
p(x) € l como la intersección de la recta que pasa por p y por x (que denotaremos 
(p,x))* con la recta l: 


p(x) = (p,x) N £. 


Esta definición tiene sentido sólo cuando x no está en la 
paralela a l por p, pues entonces no hay tal intersección. 
Sea fl, la paralela a l que pasa por p, entonces ( está 
bien definida como función 


p: Ri Lp >. 


Por ejemplo, en el caso en que l es la recta y = 1 (% del ejemplo anterior) y que 
p = 0, se tiene que 


p(x,y) = (x/y, 1), (6.2) 


que está bien definida cuando y 4 O. 


lYa habíamos usado la notación (—,—) para el plano generado por dos vectores, pero por el 
contexto en que se usa no debe causar conflictos, y más adelante se justificará este abuso. 
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Ahora sí estamos en posición de demostrar el siguiente lema que responde a nuestra 
pregunta inicial. 


Lema 6.1 Sean l; y l, dos rectas en R? parametrizadas afínmente con parámetros s 
y t respectivamente; y sea p un punto fuera de ellas (1.e. p ¿£1Ufl>2). La proyección 
desde p de l; al, tiene la expresión paramétrica 


as+b 
cs+d 


L(s) = 


para algunas constantes a,b,c,d ER y no todas ellas cero. 


(b,d) Demostración. Por el Teorema 7? existe una única 
transformación afín de R? que manda al punto p en el 
origen y a la recta fl, en la recta £ : y = 1 haciendo 
corresponder al parámetro t con el parámetro natural x; 
es decir, que manda a p en O, al punto base en l, (t = 
0) en (0,1) y al punto en fl, con t = 1 en (1,1). Esta 
transformación afín manda a la recta l en una nueva 


NN > recta % que, al parametrizarse con s, tiene la expresión 
(a,c) 


=([(as+b,cs+d)|s ER), 


para algunas a,b,c,d € R no todas cero, pues (b, d) 4 (0,0) ya que p £ l;. Puesto 
que la proyección desde un punto es una construcción geométrica que no cambia por 
transformaciones afines (ya que éstas preservan rectas), entonces de la ecuación (6.2) 
y lo anterior se obtiene el lema. Ol 


Para fijar ideas, veamos un ejemplo concreto y a través de él la idea de otra 
demostración que si siguieramos en general daría una enorme complicación de letras, 
aunque no así de números. 


Ejemplo 


Sean p = (1,3), 


lí = [(Qs+1,)5+2)|sE€R), 
ll = ((t-1,2-t)|teR). 
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Queremos escribir la proyección (q de l¡ a l, desde p 
definida en (6.1) como una función u entre los parámetros 
correspondientes. Para hacerlo, será conveniente escribir 
las rectas como funciones, es decir l(s) = (2s+1,s +2) 
y análogamente para l7. Tenemos entonces que 


l1(s),l,(t) y p están alineados 
4 (s) —p | (0) =p 
(2s,s — 1) || (t-2,-t-1) 
2s(—t— 1) — (s— 1)(t-2) =0, 


u(s) =t 


TIT 


donde usamos el criterio de que dos vectores son paralelos si y sólo si su determinante 
es cero. Y de esta última ecuación ya se puede despejar t en términos de s. Al 
desarrollarla nos da: 


—=3st+t-2 = 0 


t(-3s+ 1) = 2 
Bis —2 
381 
que nos dice que la función buscada es 
—2 
uls) = 37 + 


EJERCICIO 6.1 En el ejemplo anterior, encuentra la función inversa de u, es decir la 
expresión paramétrica de la proyección desde p de fl, en f;; llamémosla v. 


EJERCICIO 6.2 ¿En dónde no están definidas las funciones u y v? ¿A qué corresponden 
geométricamente? Haz un dibujo. 


EJERCICIO 6.3 Existe un único punto en fl, que no está en la imagen de la proyección. 
¿A qué t corresponde, y cómo se obtiene geométricamente? 


EJERCICIO 6.4 —Análogamente, cuál es la única s que no está en la imagen de v. 
Dibújala. 

EJERCICIO 6.5 Sean ly =((s —1,25+2)|s € Rj y Ll =((3t+2,-—t+1) | te R). 
Encuentra las expresiones paramétricas de las proyecciones de l¡ a ly y de l, a l¡ desde los 
puntos p= (1,1) yq= 2,2): 
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6.2.2 Transformaciones de Moebius 


Motivados por la sección anterior definamos una transformación de Moebius? como 
la expresión 


ax +b 


u(x) = NE (6.3) 


donde x es una variable en IR y a, b,c, d € R son constantes y no todas ellas son cero. 

La hemos llamado “expresión” y no función pues tiene un problema. Para el 
número real xy que cumple cx + d = 0 (xo = —d/c) no está definida como número 
real, pues no se puede dividir por cero. Sin embargo, es claro que el límite de u(x) 
cuando x tiende a xy es infinito. Al aproximarnos por un lado de xo (de tal manera 
que cx + d tenga el mismo signo que ax + d) da valores tan grandes como queramos 
(nos aproximamos a oo por el lado positivo), y al aproximarnos a Xy por el otro lado 
nos aproximamos a oo por el lado negativo. Si le añadimos a la recta real un punto 
al infinito, 4 mandaría naturalmente a —d/c al infinito. Formalicemos esta idea: 


Definición 6.2.1 La recta proyectiva, P', es 


P!:=RU(o), 


es decir, consta de los números reales junto con un nuevo punto llamado infinito y 
denotado oo al que se aproxima uno creciendo tanto por el lado positivo de la recta 
como por el negativo.* 


Y entonces hemos demostrado una parte del siguiente lema. 


Lema 6.2 La transformación de Moebius (6.3) define una función 


Pos pl 


que es biyectiva si y sólo si ad— bc 4 0. 


Demostración. Hemos visto que u está bien definida en todo RR, haciendo u(—c/d) = 
oo. Nos falta definir (oo); y esta definición de nueva cuenta es natural pues u tiene 
un límite bien definido en oo. Esto se ve cambiando de variable: 


a ax +b tia Y) HO, a+by a 
x>0 cx+d  y>0c(l/y)+d y>0c+dy c' 


Definimos entonces (oo) = a/c si c 40, y u(o0o) = 00 si c =0. Por lo tanto u está 
bien definida en todo el dominio. 


? real, deberíamos especificar, pues el uso más común del término es con el campo de los números 
complejos C en vez del de los reales RR; nótese que sólo se usará que IR es un campo. 

3La recta proyectiva compleja, CP! := CU (oo), con las transformaciones de Moebius complejas 
producen una geometría riquísima (ver, e.g. [24]), también conocida como esfera de Riemann. 
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Para ver si es biyectiva o no, intentaremos encontrar la función inversa. Pensamos 
entonces en una nueva variable, y digamos, definida por 


_ ax+b 
—ex+d” 
y tratemos de despejar x: 
ylex+d) = ax+b 
ecxu+dy=ax = b 
x[cy —a) = —dy+b, 
de donde 
dy —b 
== 
=cy +4 


Hasta ahora, no hemos puesto cuidado en si dividimos por cero o no; hemos procedido 
intempestivamente. Pero procedamos ahora más formalmente para demostrar lo que 
nos falta. Esta última expresión nos dice cuál, si acaso, debía ser la inversa. Así que 
definamos 


dy —b 
MS (6.4) 
—=cy +4 
Por la primera parte de esta demostración, v es una función de IP! en P!; y cumple 
d pPEEN -—b 
roty = LED 
Nes (5) Fa 
adx + bd-— bcx — bd 


acx — bc + acx+ ad 
(ad — be)x 
ad — be 


Si ad— bc 40, esta última expresión es x (para cualquier x € R y también cuando 
x = 00 usando las definiciones); de tal manera que | es biyectiva pues su inversa es 
Y 


Nos falta ver que si ad— bc = O entonces u no es biyectiva; de hecho es constante. 
Esto se puede ver por cuatro casos cuando alguna de las constantes es distinta de 
cero. Por ejemplo, si d 4 0, multiplicando arriba y abajo por d en la expresión de u 
se obtiene 


ra d(ax+b)  adx+bd 
pH alex +d)  díex+d) 
bex+bd  blcx+d)  b 


d(cx+d) dí(cx+d) ad? 


independientemente de la x. Como los otros casos, que se dejan al lector, son análogos, 
esto demuestra el lema. O 
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Observemos que en la demostración anterior encontramos la fórmula de la inversa 
de una función de Moebius y que ésta de nuevo resultó del mismo tipo. Si definimos a 
las proyectividades de P' (también conocidas como las transformaciones de Moebius) 
como 


b 
A O 


-—fu- Pl 1 == 
E E A 


tenemos entonces: 
Teorema 6.3 Pr(1) es un grupo de transformaciones de la recta proyectiva P”. 


Demostración. Como la identidad es claramente una transformación de Moebius 
(tómese a =d = 1 y b=c =0) y hemos visto que sus inversas también lo son, 
sólo nos falta ver que la composición de transformaciones de Moebius también es de 


Moebius. Sean 
el: PE PEC > 
pei ig yx +06" 


Se tiene entonces que 


(o v)(x) 


ll 
E VE 
| 


Si pensamos que la recta proyectiva es una extensión de la recta real (se le añadió 
el punto al infinito), resulta entonces que las transformaciones afines son precisamente 
las proyectivas que fijan al infinito. Es decir, las proyectivas son una extensión de 
las afines. Pues si u € Pr(1) es tal que (oo) = oo, entonces (siguiendo con la 
expresión (6.3)), como u(oo) = a/c, se tiene que c = 0. Esto implica que d 4 0 (pues 
ad — bc 4 0) y por tanto 

u(x) = (a/d)x + (b/d), 
que es una transformación afín. Hemos demostrado que Af(1) C Pr(1), y más 


precisamente que 
Af(1) =(u € Pr(1) | (00) = 00), 


pues estas transformaciones de Moebius pueden interpretarse como transformaciones 
de R en R. 


EJERCICIO 6.6 Para diversas transformaciones de Moebius (las que aparecen en los 
ejercicios anteriores, cuando menos), encuentra sus composiciones y sus inversas. 
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EJERCICIO 6.7 Sean tl1 y l2 dos rectas parametrizadas y p un punto fuera de ellas. 
Demuestra que la transformación de Moebius que relaciona sus parámetros es afín si y sólo 
si las líneas son paralelas. 


6.2.3 Teorema de 3 en 3 


Si las transformaciones afínes mandan cualquier pareja de puntos en cualquier otra, 
ahora las proyectivas mandan ternas en ternas (correspondiendo al hecho de que con 
Pr(1) el infinito ya puede ir a cualquier otro punto). 


Teorema 6.4 Dadas dos ternas 0%,01,%2 Y Bo, B1,B, de puntos distintos en P*, 
existe una única transformación proyectiva u € Pr(1) tal que u(04) = f; para i = 
0,1,2. 


Demostración. Veamos primero el caso en que Xy =0,a1 = 1, 7 = 00. Estamos 


buscando 
ax + b 


ex+d 


u(x) = (6.6) 


(i.e., las constantes a, b,c, d € R) tal que u(0 4) = fB; parai= 0,1,2. Las condiciones 
nos dan tres ecuaciones 


b +b 
<= Bo; == Br» —= Ba. (6.7) Ba B, 


Supongamos primero que las f; son reales (i.e., que ninguna es 00). De la primera 
y la tercera ecuación se obtiene b = fBod y a = fc, que, al sustituir en la segunda, 
nos da 


(B2 — B1)c + (Bo — B¡)d=0. 


Esta ecuación lineal con dos incógnitas tiene como una solución no trivial (recuérdese 
el compadre ortogonal): 


c=B1=B0, d=B2—B, 


y por tanto 


a= B20B: — Bo) , b= BolB2 — B1) : 


Si alguna de las f8; fuera oo (digamos fjy = 00), la ecuación correspondiente nos 
indica que el denominador es cero (en el ejemplo, que d = 0). Y de cualquier manera 
el sistema tiene solución (que se deja al lector). 

En el caso general (las a, son cualesquiera), se puede proceder de dos maneras. La 
primera, más económica en casos particulares, sería traducir las ecuaciones u(0 4) = B, 


[> 
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a ecuaciones lineales para obtener el siguiente sistema de tres ecuaciones con cuatro 
incógnitas (a, b,c, d): 


aa + b — Ape — Bad = O 
aa + b = 04 = Bid = 0 
oa + b = 0 


| 
ES 
D 
hm 
o 

| 
D 
hm 
a 

| 


(en el caso en que todas las constantes sean reales, o uno equivalente cuando aparezcan 
infinitos); y luego encontrar una solución no trivial. O bien se puede proceder usando 
el caso que ya resolvimos y que las transformaciones de Moebius no constantes tienen 
inversa. Si v (y, respectivamente, u) es la transformación de Moebius que manda 
a 0,1,00 en %, «1, 2 (y, respectivamente, en Bo, fB1, BP), entonces la que estamos 
buscando es Lo v”!, 

Falta demostrar que la transformación de Moebius que hemos encontrado es única. 
Para esto, consideremos primero un caso muy especial, cuando las dos ternas en 
cuestión son la terna canónica 0, 1, oo. Supongamos entonces que una transformacion 
de Moebius u, dada por (6.6) cumple que u(0) =0, u(1) =1 y u(00) =00. Queremos 
demostrar que es la identidad. En este caso, las ecuaciones (6.7) nos dan: 
a+b 1 a 


al? $ 


b 
== =00% 
d 
La primera dice que b = 0 y la tercera que c = O, así que la segunda implica que 
a = d. Y en consecuencia 
a 
Xx) ==x=X, 

px) 4 
como queríamos demostrar. Nótese que no se obtiene que a = 1 = d; simplemente 
demostramos que a = d (y que son distintas de cero), y por tanto que a/d = 1. Pues 
aunque las transformaciones de Moebius están bien definidas, las constantes a, b,c,d 
que las definen no están específicamente determinadas: si multiplicamos a todas ellas 
por una misma constante no cero, obtenemos la misma función. El caso general se 
sigue de éste usando las propiedades de grupo. Dejamos los detalles al lector, pues a 
continuación lo veremos con una mejor notación. Ol 


Matrices asociadas 


Conviene recapitular un poco y establecer nueva notación. Una función de Moebius 
está determinada por cuatro constantes reales, que, como ya nos ha sucedido, y por 
varias “casualidades” que se nos han presentado, conviene empaquetar en una matriz. 


Sea A la matriz 
a b 
a=(¿ 0 
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Si esta matriz es distinta de la matriz cero (A 4 0), le podemos asociar la función de 


Moebius 
ax +b 


ex+d 
Obsérvese que para t 4 0 se tiene que Ua = Hia, Pues 


ua (x) = 


taxsotb  tlax+b) ax+b 
o tex+td tícx+d) cx+d' 


Ha (x) 


Esta asignación de matrices a funciones de Moebius tiene además las bonitas propiedades 
siguientes: 

Primero, ua es una transformación (biyectiva) si y sólo si det(A) 4 0; es decir, 
si y sólo si A es invertible (veáse el Lema 6.2). 

Segundo, en este caso, la inversa de la transformación de Moebius corresponde 
a la inversa de la matriz, pues en la ecuación (6.4) las constantes corresponden a la 
matriz det(A)A”!, que por lo anterior tiene asociada la función de Moebius Ha-1 
(podemos resumir, (ua)! = Ur-1). 

Y tercero, por la ecuación (6.5), la composición de transformaciones de Moebius 
corresponde a la multiplicación de matrices, es decir, 4x1 0 Hg = Hap- 

Estas tres propiedades se resumiran en la frase: “la función GL(2) > Pr(1) dada 
por A > ua es un homomorfismo de grupos”. 

Ahora sí podemos concluir con elegancia la unicidad en la demostración del Teo- 
rema de “tres en tres”. Habíamos demostrado que si 4, cumple que ua (0) = 0, 
ua (1) = 1 y ua (00) = 00, entonces A es diagonal (a =d 40yb=c=0). Tenemos 
entonces que 


HA[0)=0, Ha(1)=1 y Harloo)=0 $ A=tlI con tHX0. 


Supongamos ahora que A es una matriz cuya transformación de Moebius fija 
tres puntos distintos cualesquiera; es decir, tal que L1(04) = 04 para i= 0,1,2 
con 4 4 01 4 A, % %y. Por la primera parte del Teorema 6.4, existe una matriz 
invertible B tal que ug (0) = %o, lg (1) = 0 y Ugloo) = 0%. Es fácil ver que entonces 
la transformación de Moebius ug -1+ o HA o Hg fija a 0, l, oo y, por el caso que ya vimos, 
existe t 4 0 tal que 

B AB=tL 


Multiplicando por la izquierda por B y por la derecha por B”! se obtiene 
A=B(tD)B"? =t(BIB") =t(BB!) =t1. 


Supongamos, por último, que A y B son dos matrices cuyas transformaciones de 
Moebius mandan una terna en otra terna igual, el caso general. Entonces 41-1 0 Hp 
fija la primera terna, y por lo anterior se tiene que existe t 4 0 tal que 


AB =tl, 
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multiplicando por A tenemos que 
B=A(tD =t(AD =tA. 


Lo cual demuestra que inducen la misma transformación de Moebius. Y queda 
demostrado que 
Ha=Mg € B=tA con tX0. 


EJERCICIO 6.8 Considera las siguientes ternas de puntos en Pl: a = (0,1,00), 
b =(1,2,3), e = (-1,0,1), d= (-1,00,1). Encuentra una expresión para las 12 transfor- 
maciones de Moebius que mandan, ordenadamente, a una de estas ternas en otra. 


6.2.4 La recta proyectiva y R? 


No por casualidad aparecieron las matrices para ayudarnos en la sección anterior. 
Recapitulemos. Las matrices invertibles habían surgido como los paquetes de in- 
formación para definir las transformaciones lineales de R?. Y ahora surgen como 
paquetes de información para transformaciones de Moebius con la ambigiúedad de 
una constante no cero. Para que la matriz A “actúe” en R? teníamos la siguiente 


fórmula 
a b x Y  ( ax+by 
(Ea) (a) eras): 65 


Recordemos también (6.2) que la proyección desde el origen 
de R? a la recta canónica y = 1 tiene la expresión 


PSN e) 0). 


de tal manera que si identificamos al punto (x, 1) en la recta 
canónica con su primera coordenada x en RR, podemos escribir 
(entrecomillado por el abuso de notación): 


=0tA (5) 0 ax+b ) _ax+b, 

1 cx+d ex+d 

Más formalmente, si l es la recta canónica y = 1 y f es la función lineal asociada a 
A, podemos concluir que a es la función de Moebius que relaciona los parámetros 
naturales de la recta f(2) = [(ax + b,cx + d) | x € R] y la recta l con la proyección 
desde el origen. Lo cual demuestra que toda transformación de Moebius surge de una 
proyección. Pero esto se puede formalizar de manera más elegante y sin entrecomi- 
llados. 
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Proporciones 


Los antiguos griegos pensaban a los números reales como proporciones entre números 
enteros. Por ejemplo, lo que ahora conocemos como 1/2 o 0.5, ellos lo pensaban 
como la proporción del 1 al 2, o del 2 al 4 o del 3 al 6... que en la escuela primaria se 
denota “1:2=2:4=...”. Se llevaron una gran sorpresa cuando geométricamente 
encontraron un número (una distancia), a saber V2 (la hipotenusa del triángulo 
rectángulo isósceles con lado unitario), que no se podía expresar de esta manera. 
Ahora sabemos que no todos los números reales son racionales, pero en fin, la idea 
básica es buena y ahora la retomamos pero de manera más general, pensando en 
propociones no sólo de números enteros sino de números reales. 

Cada número real x € [R se puede pensar como la proporción del x al 1, que es 
la misma proporción del 2x al 2, o del tx al t para cualquier t. Una pareja (x, y) 
cualquiera, como proporción x : y, representa al número que, multiplicado por y, nos 
da x. El 0 es entonces la proporción del O a cualquier t y podemos pensar al oo 
como la proporción de cualquier número al 0. En el texto anterior surge una terrible 
ambigiedad respecto a la pareja (0,0); vuélvase a leer con ese ejemplo maligno en 
mente y se verá que podría representar a cualquier proporción, a cualquier número. 
Pero si eliminamos a la pareja (0,0) y exigimos que t nunca sea cero, la ambigiedad 
desaparece. Formalicemos la idea, con la notación de las proporciones de primaria. 


Definición 6.2.2 Dado (x,y) € R?, (x,y) 4 (0,0), sea 
lx: yl :=((tx,ty)|teR, t40). (6.9) 


Que se puede leer “la proporción de x a y”. Siempre que consideremos la expresión 
[x : yl, suponemos que no ambas “coordenadas” son cero. 


Observemos ahora que los puntos de la recta proyectiva corresponden biunivoca- 
mente a las proporciones, pues a x € R le corresponde la proporción [x: 1] y al oo 
le corresponde la proporción [1 : 0]. E inversamente, a la proporción [x : y] le corre- 
sponde el número x/y (donde x/0 = oo cuando x % 0). De tal manera que podemos 
redefinir a la recta proyectiva como 


P!= (le: 9) 1(0,0) 4 (xy) ER?). 


A esta manera de ver la recta proyectiva se le conoce como la dada por coordenadas 
homogéneas. Así, un punto en P! dado por coordenadas homogéneas es la proporción 
[x: y]. La gran ventaja es que ahora todos los puntos de IP? pueden ser tratados 
de la misma manera; ya no hay que hacer distinciones para oo; la homogeneidad es 
evidente. 


Rectas por el origen 


Hemos definido a [x : y] en (6.9) como un subconjunto de ¡R?, que es precisamente 
una recta por el origen. Así que los puntos de P! corresponden a las rectas por el 
origen en R?. 
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Si pensamos, como ya lo hicimos antes, en la recta y = 1 
[2:y] como los reales, la correspondencia [x: y] H—= x/y corre- 
sponde a intersectar la recta por el origen [x : y] con la recta 


(24) canónica y = 1, y la única que no tiene intersección (el eje 
de las x dado por y = 0) corresponde al infinito. 
pil Conviene entonces introducir la notación 
1/y 
mm lx] := [x: y], donde (0,0) % (x,y) =x € R?. 


Esto nos da una función (x + [x]) de R?—(0) sobre P*, en la 
cuál la imagen inversa de un punto en P! es la recta por el origen a la que corresponde, 
pues obsérvese que por la definición [x] = [tx] para cualquier t 4 0. 

Ahora, las transformaciones proyectivas se expresan en coordenadas homogéneas 
de manera muy natural. Dada una matriz A € GL(2), su transformación proyectiva 
LA se expresa como 


pa : P! => P! 
Ha (lx]) = [Ax], 
pues si A es como en (6.8) y x = (x,y) tenemos que 
[Ax] = [ax + by : cx + dy]. 


Esto concuerda con nuestra antigua idea de transformación de Moebius pues el número 
x en coordenadas homogéneas es [x: 1] al cual A manda en [ax +b: cx + d] que 
corresponde a (ax + b) /(cx + d), y el infinito corresponde al [1 : 0] que va en la : c] 
que corresponde a a/c como debía ser. 

Este enfoque es el adecuado pues fácilmente se generaliza a más dimensiones. 
Pero antes de hacerlo haremos una clasificación topológica de las transformaciones 
de Moebius, y regresaremos brevemente con el pintor y algunos de sus problemas 
prácticos. 


EJERCICIO 6.9 Con nuestra nueva definición de P! y de transformaciones proyectivas, 
es decir, con coordenadas homogéneas y matrices, demuestra el Teorema de 3 en 3. 


6.2.5 Tipos de transformaciones 


Aunque no lo hayamos dicho explícitamente, a la recta proyectiva se le puede pensar 
también como un círculo. Puesto que a la recta real se le añade un único punto al 
que se llega por ambos extremos, éste cierra el círculo. O bien, pensado como rectas 
por el origen en R?, si tomamos el casquete superior del círculo unitario (definido por 
[(x, y) €S' | y > 0)), cada recta lo intersecta en un punto único excepto la horizontal 
que lo intersecta en los dos extremos; al identificarlos, nos queda un círculo (de la 
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mitad de la circunferencia). En esta sección, vamos a pen- 
sar a IP? como un círculo para describir topológicamente, es 
decir a grandes rasgos, cómo son las transformaciones de 
Moebius. 
Los dos “invariantes” de las transformaciones de Moe- 


bius que nos servirán son el número de puntos fijos, y la ¡MN . 
orientación; es decir si preserva o no orientación. Esta úl- 

tima se detecta por el determinante de una matriz asociada; E 

si es positivo, un punto viajando en P! va en la misma di- 4 A 
rección en que viaja su imágen, y si es negativo, éstos viajan 


en direcciones contrarias. Esto se ve claro en nuestro mod- 
elo lineal de Pr(1), es decir, pensando en líneas por O en ¡R?. Pero observemos 
que el determinante no está definido para transformaciones de Moebius, pues sus 
matrices asociadas difieren por un factor no nulo; aunque su signo sí lo está, pues 
det (tA) =? det (A). 

Veamos ahora los posibles puntos fijos de ut, € Pr(1). Por el Teorema de 3 en 
3, si fueran tres sería la identidad, así que HA % id tiene a lo más dos puntos fijos. 
Esto también se puede ver de otras dos maneras. Primero, de la fórmula númerica al 
tratar de resolver la ecuación 


ax +b 


ía ad iia 


que se traduce en encontrar las raíces de la ecuación cuadrática 
cx? + (d— ajx—b=0. 


Y segundo, buscando vectores propios (recordar el Capítulo 4) de la matriz A, pues 
son vectores v no nulos para los cuales Av = Av para alguna A € R (y por tanto 
La [v] = [Av] = [Av] = [v], pues A % 0 porque det A % 0). Con este enfoque, habría 
que encontrar los valores propios de A como las raíces de su polinomio característico 


det (A—AD) =M-—(a+d)A+ad-— bc. 


En ambos casos hay que resolver una ecuación de segundo grado que tiene a lo más 
dos soluciones reales. Y cuántas son depende del signo de su discriminante, es decir, 
de lo que queda dentro de la raíz cuadrada al aplicar la fórmula del “chicharronero”; 
pero en ambos casos queda lo mismo: 


(d— a)? +4bc= (a+ d)' —4(ad— bc). (6.10) 


Notemos primero que si 4, invierte orientación, 1.e., si det A < 0, entonces, de su 
última expresión, se tiene que el discriminante es estrictamente positivo y tenemos 
por tanto dos puntos fijos. Dejaremos el análisis de este caso hasta el final. 

Si 41 preserva orientación, el discriminante (6.10) puede ser negativo (no hay 
puntos fijos), cero (hay un punto fijo) o positivo (hay dos puntos fijos). 
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Rotaciones. Como ejemplo de 4, € Pr(1) sin puntos fijos, podemos tomar 


O 


a la matriz A de una rotación con ángulo entre 0 y Tr. Todas las rectas 
en el plano por O se mueven, y IP, como círculo, simplemente gira. No 
todas las transformaciones de Moebius sin puntos fijos son tan simples; 
pero escencialmente sí. Todos sus puntos se mueven en la misma dirección, 
aunque la “distancia” que se mueven varía. 


Translaciones. Si u € Pr(1) tiene un punto fijo, podemos suponer que es el 


O 


infinito. Entonces u es afín, y si no tiene más puntos fijos, es fácil ver que es 
una traslación (Ejercicio 3.19). Estas transformaciones (con un solo punto 
fijo) mueven a todos los puntos de PP! en la misma dirección, excepto al 
punto fijo, y a los cercanos a él los mueven cada vez más poquito. Si p es el 
punto fijo, la suceción u” (q) para cualquier q 4 p tiende a p por el mismo 
lado, y la suceción u” (q) tiende a p por el lado contrario. 


Expansiones. La transformación proyectiva f(x) = kx con k > 1 (pensando 


en la recta extendida), fija al 0 y al oo, y cualquier otro punto se aleja del 
cero y se acerca a oo. A 0 se le llama el punto expulsor y a oo el atractor; 
pues las sucesiones f” (x) tienden a oo y las f" (x) a 0 para cualquier otro 
punto x. Toda transformación de Moebius con (exactamente) dos puntos 
fijos y que preserva orientación es de este tipo. Uno de sus puntos fijos es 
expulsor y el otro atractor, los demás puntos se mueven de uno hacia el 
otro. 


Consideremos por último a u € Pr(1) que invierte orientación. Ya vimos que 


entonces tiene dos puntos fijos, p y q digamos. Como u? = uo u preserva 
orientación y tiene los mismos dos puntos fijos entonces es una expansión 
con uno de sus puntos fijos de expulsor, p digamos, y el otro, q, de atractor; 
diremos entonces que es una e-reflexión de p a q. Pero hay otra posibilidad: 
que uu? = id; y entonces diremos que es la reflexión en los 
puntos p y q. Así, una e-reflexión es una reflexión seguida de 


una expansión (de ahí el nombre que le hemos dado), y la dirección 
queda determinada por el valor de uu? (x) para cualquier otro punto x 
(si 1? (x) está entre x y q, va de p a q, y si está entre x y p, va de q 


a p). 


Hemos dicho implícitamente que la reflexión queda determinada por dos puntos 
p + q, sus puntos espejo, pero no lo demostramos. Consideremos una transformación 
de Moebius g que manda a p, q en 0, oo respectivamente y analicemos primero este 


= 


00 


caso particular. Una f € Pr (1) que fije al 0 y al oo se escribe f (x) = kx para 
alguna k 4 O (es lineal), y si además invierte orientación se debe cumplir que 
k< 0. Como f? (x) = k? x, se tiene que f? = id solamente cuando k =—1 (para 
k < —1, f es una e-reflexión de O a oo, y para —1 < k < 0 es una e-reflexión 
de oo a 0). Sea p la reflexión en 0 y oo, es decir, p(x) = —x (ya hemos 
demostrado que es única y que ésta es su fórmula). Para obtener la reflexión en 


P y q, conjugamos con g: sea 
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Pra = 9 opog. 
Se tiene que p, , (p) = g* (p(g(p)) = g' (p(0)) = g* (0) = p, análogamente 
Pp. a (4) = q; además que p, ¿invierte orientación pues g y g”| son del mismo tipo y 
p invierte orientación, y por último 
a =lg9 opog)o(g'opog)=g'opopog=g'og=id. 
Lo cuál demuestra que la reflexión en p y q está bien definida y da una fórmula 
usando el Teorema de 3 en 3. En resumen, se tiene el siguiente lema. 


Lema 6.5 Dados cualesquiera p, q € P' con p 4 q, existe una única Pre BES 

llamada su reflexión, que los tiene como puntos fijos, invierte orientación y cumple 
2 a 

que Pi y =1d. O 


A diferencia de la recta euclidiana donde cada par de puntos define un segmento 
y dos rayos exteriores, dos puntos en la línea proyectiva, que topológicamente es 
un círculo, la parten en dos segmentos; no hay manera de decir cuál es “el bueno”, 
podemos ir de un punto al otro usándolos indistintamente. Pero la naturaleza es muy 
sabia, y nos da, en la línea proyectiva, una manera canónica de identificar a estos 
dos segmentos entre sí, que es la reflexión en esos dos puntos. De alguna manera, 
que se hará explícita cuando veamos la geometría hiperbólica, esta información (una 
reflexión para cada par de puntos), define a la línea proyectiva pensada a la Klein: un 
espacio, el círculo, junto con un grupo de transformaciones. Por lo pronto, considera 
el último de los ejercicios que siguen. 


EJERCICIO 6.10 Para cada una de las siguientes matrices, describe qué tipo de trans- 
formación de Moebius determina: 


00 110 «00 
d) E SN e) E 3 


EJERCICIO 6.11 Demuestra que si f € Pr (1) es una traslación, entonces existe yg € 
Pr (1) tal que (g7 ofo g) () =x+1. 

EJERCICIO 6.12 Demuestra que si f € Pr (1) es una expansión entonces existe yg € 
Pr (1) tal que (g7 ofo g) (x) =kx con k > 1. 

EJERCICIO 6.13 Demuestra que si f € Pr(1) es tal que f” = id con n > 3, pero 
f” 4 id para m < n, entonces f es una rotación. 

EJERCICIO 6.14 Demuestra que la reflexión en 1 y —1 es la función v (x) =1/x. 


EJERCICIO 6.15 Sea a € R C P!; demuestra que la reflexión en a e oo es la reflexión 
(isométrica) en a. 
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EJERCICIO 6.16 Sean a,b € R C P! dos puntos distintos. Demuestra que la reflexión 
en a y b tiene la matriz asociada 
a+b  —2ab 
2 =a—b J)' 


EJERCICIO 6.17 Considera dos parejas distintas, p, q y a, b, de puntos en P' (pensado 
como círculo). Observa que hay tres posibilidades topológicas de colocarlas en el círculo: 
primero, una pareja está contenida en uno de los segmentos que define la otra (y entonces 
sucede lo mismo al intercambiarlas); segundo, uno de los puntos de las parejas coincide 
(p = a, digamos), y tercera, las parejas se cruzan, es decir, a y b están en segmentos 
distintos de p a q. Discute cualitativamente, y demuestra si puedes en algunos casos, qué 
tipo de transformación es la composición de las reflexiones correspondientes, Py q 9 Pab- 
(Empieza por el segundo caso que es el más simple y es límite, o transición, de los otros 
dos.) 


6.2.6 Armonía 


Las reflexiones traen implícita a la extensión natural de armonía que vimos en el 
Capítulo 2, donde surgió la noción de cuarteta armónica o de par de parejas armónicas 
en la recta afín; y ahora se completa incluyendo al infinito. 
Dada una pareja p, q de puntos en P! (piénsese en el ejemplo 1, —1) decimos que 
a y b son armónicos respecto a p y 4, si la reflexión en p y q manda a a en b, es 
decir, si 
Pp q (a) =b 


(en el ejemplo, y por un reciente ejercicio, si b = 1/a). Obsérvese que “ser 

1 armónicos” es realmente una relación de parejas pues P, q = Pq y está deter- 

minado por la pareja (sin orden), y si p, ¿ (a) = b entonces py ¿ (b) = a pues 
0 = id; además, fijando la pareja p, q cualquier otro punto tiene su armónico: el 
complemento (1P — (p, q)) se aparea en pares armónicos respecto a ellos. 

Esta noción de armonía coincide con la euclidiana (y de hecho la extiende), pues 
vimos que el apareamiento armónico respecto a p, q (reales) consistía en pensar al 
intervalo p, q como el —1,1 (por una afinidad) e invertir (por la función x += 1/x); 
sólo el punto medio no tenía par armónico, pero ahora le corresponde el infinito. 

Veámos ahora que las transformaciones de Moebius preservan armonía. Sean 
f € Pr(1) y a, b un par armónico respecto a p, q; queremos demostrar que f (a), f (b) 
es un par armónico respecto a f(p),f(q). Por el mismo argumento del párrafo 
anterior al Lema 6.5 se tiene que la reflexión en la pareja f (p) ,f (q) se escribe 


a —1 
Prip),ta) = O Pp o, 


y al aplicar esta formula a f (a) se obtiene f (b). 
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Nos falta ver que la relación de armonía es simétrica, es decir que si p, ¿ (a) = b 
entonces Pay (p) = q. Con una transformación proyectiva podemos mandar p al 0, 
q al oo y a al 1; entonces, por lo anterior, manda b al —1. En este ejemplo se tiene 
que 0,00 son armónicos respecto a 1, —1; mandándolos de regreso se tiene entonces 
lo que queríamos. Podemos resumir en el siguiente teorema. 


Teorema 6.6 Las transformaciones de Moebius preservan cuartetas armónicas y son 
transitivas en ellas. O 


Por último, notemos que al pensar a la recta proyectiva como líneas 
en R?, obtenemos una relación de armonía en cuartetas de líneas con- 
currentes: es que la correspondiente cuarteta de puntos en P! sea ar- 
mónica. Y esto se detecta al intersectarlas con cualquier otra recta 
que no pasa por el punto de concurrencia, revisando que los puntos de 
intersección sean armónicos. En particular, si trazamos una paralela a 
una de ellas, su pareja la debe intersectar en el punto medio de las intersecciones con 
el otro par (pues hemos mandado a uno de los puntos intencionalmente al infinito, 
que es el armónico de su punto medio respecto a un segmento). 


EJERCICIO 6.18 Demuestra que a, b son armónicos con p, q si y sólo si sus reflexiones 
conmutan, es decir, 

Pp a Pap — Pap 2 Pp q: 
EJERCICIO 6.19 Demuestra que las bisectrices de cualquier par de rectas es un par 
armónico a ellas. 


6.3 El problema del pintor II 


Recordemos el problema del pintor que quiere pintar en un lienzo una vía de fe- 
rrocarril y nos pregunta ¿a cada cuántos centimetros debo dibujar los durmientes? 
Motivados por este problema definimos la línea proyectiva junto con su grupo de 
transformaciones y hemos desarrollado una gran teoría con posibilidades de genera- 
lizarse a otras dimensiones; pero antes de hacerlo, es justo que hagamos una pausa 
y le respondamos. Ya podemos darle respuestas numéricas y además constructivas 
(recetas que usan los arquitectos) basados fundamentalmente en el Teorema de 3 en 
3 y en que los elementos del grupo de transformaciones de Moebius se pueden ver 
como proyecciones. Pero además, para desarrolllar la intuición y como motivación 
para entrarle al plano proyectivo, veremos que nuestros métodos funcionan al ampliar 
el problema a dibujar una cuadrícula en un piso. 
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El riel (izquierdo, para fijar ideas) se dibuja como una línea 


recta en el lienzo, y esta línea tiene un punto distinguido: — 4 
el punto de fuga en donde los dos rieles de la vía parecen hi 
juntarse. Con ese punto y cualquier otro, el del durmiente 0 
digamos, se define esa recta. Sabemos que la función que nos 

dice a dónde debe ir el durmiente n es una transformación 


de Moebius, y que ésta estará determinada por la imagen del 
durmiente 0, el punto de fuga, oo, y algún otro punto. Así 
que si el pintor nos da el oo, el durmiente 0 y el durmiente 1 
en el lienzo, podríamos calcular los coeficientes de la función de Moebius (después 
de medir cuidadosamente las distancias en el lienzo), programarla en una calculadora 
y regresársela al pintor para que continúe con su trabajo. La calculadora le dirá 
exactamente dónde debe dibujar al durmiente 2, al 3, etc. Problema resuelto. 


Pero no para el pintor, que requeriría de un matemático de cabecera. Él quisiera 
una solución dentro de sus posibilidades y más cercana a las técnicas que maneja. 
Veamos de nuevo. También hemos demostrado que cualquier transformación de Moe- 
bius se puede ver como la proyección de una línea en otra. Queremos proyectar una 
escala afín (la del ferrocarril real con unidad de durmientes) a la escala proyectiva 
del lienzo desde el punto fijo de visión del pintor. Puesto que es una transformación 
de Moebius entre rectas, entonces debería ser posible diseñarle una construcción ge- 
ométrica para que con líneas y puntos auxiliares en el lienzo reconstruya la escala 
proyectiva (del riel en el lienzo) a partir de una escala afín (la de su regla T, digamos) 
sin necesidad de una calculadora, o de estarle atinando a ojo. 


Suponemos entonces que tenemos definido el riel en 
el lienzo junto con sus tres puntos distinguidos. Fijemos 
arbitrariamente un punto de proyección p (fuera del riel). 
La recta l que pasa por p e oo determina la dirección 
de la recta cuya escala afín vamos a proyectar (pues el 
infinito de ésta debe proyectarse en el infinito que tenemos 
dado). Para cualquier recta paralela a 2, sus puntos de 
intersección con las rectas por p y el 0 y por p y el 1 (nos 
referimos al 0 y al 1 en el riel del lienzo) determinan la 


escala. Con un compás se puede reproducir esta escala afín 
que, proyectándola desde p, nos da la escala proyectiva en el riel. Lo maravilloso de 
la teoría que hemos desarrollado es que demuestra que este procedimiento no depende 
del punto de proyección o de la recta a proyectar que escojamos; además, demuestra 
también que coincide con el primer método (el de la calculadora), y, por si fuera poco, 
que estos dos métodos coinciden con el original de proyectar al riel verdadero sobre 
el riel del lienzo. 

Con este método, el pintor puede sacar la escala proyectiva del riel derecho (a 
partir del infinito, que comparten los rieles y los puntos donde se ven el durmiente 0 y 
el durmiente 1), luego la del riel izquierdo, y, detallando durmientes, concluir con una 
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buena perspectiva de la vía de tren. Pero aún puede simplificarse el procedimiento si 
la vía del tren está lo suficientemente ladeada para que los durmientes también estén 
en perspectiva. En este caso, que analizaremos a continuación, conviene plantearse 
un problema que parece más difícil: el de dibujar un piso cuadriculado en perspectiva. 

Queremos ahora proyectar un piso cuadriculado sobre 
un lienzo. Si le pedimos al pintor que dibuje, a ojo de 


buen pintor, una simple loseta, podremos reconstruir todo 


el piso. El o 


Pensemos que la franja del piso que contiene a la loseta 


y que se aleja a la derecha (horizontal, llamémosla) es una 
vía de ferrocarril con durmientes verticales. Las dos líneas 
horizontales parecen converger a un punto de fuga que en el lienzo es un punto bien 
definido (el infinito horizontal, voy) como el punto de intersección de las dos rectas 
definidas por los lados opuestos de la loseta ya dibujada. 

Por la misma razón, las líneas de la franja vertical convergen a otro punto (el 
infinito vertical, 00,). Si estos dos puntos de fuga caen en el lienzo (que es el caso que 
analizaremos), determinan una línea llamada horizonte (definida en el lienzo como la 
intersección de éste con el plano paralelo al piso que pasa por el ojo del pintor, en 
general, una línea horizontal en el lienzo justo a la misma altura del piso que el ojo 
de proyección). 

Sabemos que todas las líneas horizontales del piso se 
dibujan como líneas en el lienzo que confluyen al punto co, 204 


00; no importa el ancho de la vía del tren. Y por la 
misma razón, las verticales confluyen en ooy. Pero las h 
horizontales y las verticales no gozan de ningún beneficio 
(excepto el de definir la cuadrícula); cualquier otro haz Y 
de rectas paralelas se proyecta en un haz que confluye en 
algún punto del horizonte. Así que podemos tomar una 
diagonal de la loseta dada, que intersecta al horizonte en un punto que llamaremos 
infinito diagonal, 004, que está entre 00, e 00h. 
Si llamamos 0 y 1, como en el caso del ferro- 


co, cod Sl carril, a los dos vértices en un lado horizontal de 
DN la loseta, y 0” y 1' a los correspondientes del lado 

id no E opuesto, de tal manera que la diagonal pase por 0' 

y 2 y 1, entonces la línea que va de 1' a 004 es justo 


donde se dibuja la diagonal de la siguiente loseta; 
cuya intersección con la horizontal por 0 y 1 nos 
da el vértice 2 correspondiente a la siguiente los- 
eta. Trazando ahora la vertical por 2, su intersección con el otro riel nos da el vertice 
2, completando así la información para dibujar la loseta 1 (empezamos con la 0). Es 
claro que este proceso se puede iterar para encontrar los durmientes que queramos 
del ferrocarril horizontal. 
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Pero de manera análoga, se puede completar el ferrocarril vertical y por ahí en- 
medio van apareciendo los vértices de más losetas. E inclusive de losetas “negativas”. 
Este método se conoce desde el Renacimiento. Obsérvese 
que ya ni siquiera necesitamos compás, con pura regla fun- 


ciona. Y funciona bien, lo cual indica que debe haber teore- 
mas que lo sustenten. Por ejemplo ¿porqué es que los puntos 
de intersección de las diagonales con las verticales siguientes 
(0 y 1 con 2 y 2,1 y 2con 3 y 3, 2' y 3 con 4 y 4, etc.) 
quedan todos alineados con 00, ? Desde el Renacimiento se 
sabe por experiencia que así resulta, pero los fundamentos 
matemáticos tardaron siglos en desarrollarse. Por el momento dejemos esto como 
motivación para estudiar y definir al plano proyectivo, dejando también al pintor 
contento con los métodos que sí puede aplicar. 


EJERCICIO 6.20 En el primer método geométrico para encontrar la escala en el riel, el 
punto de proyección p se fijó arbitrariamente. Supón que la que se fija arbitrariamente es la 
recta l (digamos que es la orilla del restirador donde trabaja el pintor). ¿Cómo encuentras 
el punto de proyección y la escala afín en l para proyectar? 


EJERCICIO 6.21 Con regla y compás completa las siguientes escalas proyectivas aña- 
diendo los puntos que corresponden a —1,2 y 3. Haz otras. 


6.4 El plano proyectivo 


Nuestra definición del plano proyectivo será analítica, generalizando la idea de coorde- 
nadas homogéneas que acabamos de desarrollar. Esto nos permitirá hacer cálculos y 
definir objetos geométricos de manera precisa, pero peca de abstracta. En particular 
nos interesa en esta sección establecer la noción de línea y las propiedades básicas de 
incidencia. Para tener una intuición geométrica del plano proyectivo, que es muy im- 
portante, veremos en la siguiente sección otros modelos más geométricos. Es preciso 
remarcar, una y otra vez, que cada modelo geométrico tiene ventajas y desventajas, 
no hay una manera de “ver” todo el plano proyectivo de golpe, como creemos tener 
la idea del plano euclidiano. Pero observemos que esto último tampoco es cierto. Lo 
que intuitivamente sabemos del plano euclidiano, es por pequeñas porciones de él, 
el pizarrón, el piso o una hoja de papel, y de ahí extrapolamos diciendo “todo es 
así”. Lo mismo sucede con el plano proyectivo, en pequeñas porciones es como el 
euclidiano pero también incluye cierto comportamiento al infinito que se convierte en 
parte integral de él. 
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6.4.1 Coordenadas homogéneas 


Dado x = (x,y,z) € R* tal que x 2 0 (esto es, tal que alguna de las tres coordenadas 
de x es distinta de cero), sea 


Md = "y. 2l:= tx ty it $teR ts é0. 


Es decir, [x] es la recta por el origen con dirección Xx, menos el origen. Se tiene 
entonces que 
[x] = [tx] para cualquier t 4 0, 


y ésta es la propiedad clave. Además consideraremos a [0] o [0: 0: 0] como una 
expresión sin sentido. 
Definimos al plano proyectivo P? como 


P?:=[[x]]x € RÍ, x 40). 


Nos referimos a los elementos de P? como puntos y a la expresión [x : y : z] o [x] como 
un punto de P? dado por coordenadas homogéneas. 

Nótese que las coordenadas homogéneas de un punto en no son únicas (a 
diferencia de R?, donde sí lo son). Hay cierta ambigúedad, pero no es tan grave, pues 


D2 


[lx] = [y] si y sólo si y =tx para alguna t 4 0; 


así que por ejemplo, [1:2:3] = (2: 4: 6], o bien [1:0:0] =[8:0:0] = 292030]. 
Como en el caso de R? (o de IR”) los puntos de PP? tienen coordenadas, y esto nos 
permitirá hacer geometría con métodos analíticos, pero habrá que tener cuidado de 
que las definiciones no dependan de coordenadas específicas sino de las homogéneas. 


EJERCICIO 6.22  Generaliza nuestra definición de IP! y de P? para definir P3 y P”., 


6.4.2 Rectas proyectivas 


Tenemos que los puntos de P? corresponden a las rectas en R3 que pasan por el origen 

si x € Ri —(0), se puede pensar a [x] como punto en IP? ([x] € P2) o bien como 
su correspondiente línea por el origen en R* ([x] € R%). Podemos definir entonces a 
los subconjuntos distinguidos de P? que son sus rectas o líneas correspondiendo a los 
planos por el origen en R3; es decir, una recta en IP? es el conjunto de puntos cuyas 
correspondientes rectas en R* forman un plano. Tiene sentido, pues en la Sección 
6.2.4 vimos que los puntos de una recta proyectiva corresponden biunívocamente a 
las rectas por el origen en un plano. Puesto que los planos en R* están dados por una 
ecuación lineal, podemos ser más explícitos: 

Sea n un vector no nulo en R*; definimos la recta dada por n en P? como 


thi= ¿ble P |m.x=0%: (6.11) 


.... Dibujo 
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Está bien definida pues si tomamos t % 0, entonces 
n-x=0 46 n-tx=0, 


pues n - tx = t(n - x), lo cual implica que no importa qué representante de un 
punto tomemos ([x] o [tx]) la condición para pertenecer al conjunto da el mismo 
resultado (es cierta o no dependiendo del punto en P?, no del representante en R?). 
Sin = (a, b,c) entonces l, se describe por coordenadas homogéneas como 


ln:=[kx:y:z] € P|ax+by+cz=0). 


Y podemos decir que las rectas de P? son precisamente los conjuntos fl, para 
n ec R%, n 40. Notemos además que si t 4 0, entonces ly = lin, 
(pues tn -x =t(n-x) =04%Smn-.x=0). Así que la recta 
proyectiva l, depende no de n (un vector no nulo en R*) sino de 
[n] (el correspondiente punto en P?); entonces podemos definir 
para [n] € P? su recta dual 


£m] := a 


Dicho de otra manera, a cada recta por el origen en R* ([n]) le asociamos su plano 
perpendicular que pasa por el origen (lmmj). Pero además, como cada plano por el 
origen tiene una única recta perpendicular por el origen, se tiene que 


tu=tm e ml=Imi. 
Así que hemos establecido una biyección entre las rectas de IP? y los puntos de IP? 
lu => Ín] 
que llamaremos dualidad. La dualidad cumple propiedades muy bonitas que vienen 
de una básica que dice que un punto está en una recta si y sólo si su recta dual 
contiene al punto dual; es decir, dados [p] y [q] en P?, 


[pl € lia $ [q] € Lip), (6.12) 


cuya demostración es obvia pues ambas condiciones son, por definición, equivalentes 
ap-q=0. 


EJERCICIO 6.23 ¿Cómo definirías planos en P2? 
EJERCICIO 6.24 ¿Cómo definirías rectas en P9? 
EJERCICIO 6.25 ¿Habrá dualidad en P9? ¿Entre qué y qué? 
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6.4.3 Axiomas de incidencia y el quinto postulado 


Demostremos ahora las propiedades más elementales del plano proyectivo, que son 
las de incidencia, y se refieren a las relaciones “estar en” o “pasar por” que hay entre 
puntos y rectas. 


Lema 6.7 Por cualesquiera dos puntos de P? pasa una recta, y si son distintos ésta 
es Única. 


Demostración.Sean [a] y [b] puntos en P?. Si [a] = [b] 
entonces para cualquier [n] € la se tiene que [al] € lim, por a 
(6.12). Si [a] 4 [b], sea n = a x b, entonces n 4 O y se tiene que [a] [(b] 
[a], [b] € l;,,, pues n-a =n-b =0. Además, esta recta es única 
pues n genera a la recta perpendicular al plano que generan los vectores a y b.. U 


Y tenemos el resultado dual en el siguiente lema. 


Lema 6.8 Dos rectas distintas de P? tienen un único punto en común. 


Demostración. Dadas (¡q y lp, rectas en P?, si l¡q¡ = lp; no hay nada que demostrar. 
Si lía 4 li] (es decir, si [a] 4 [b]), sea n = a x b, entonces n % 0, pues a y b son 
linealmente independientes; y se tiene que [n] € lja N Li], pues a.-n=b-n=0. O 


Nótese que este lema consiste simplemente en pasar a lenguaje de puntos en P? el 
hecho de que dos planos por el origen en ¡R3 se intersectan en una línea; y el anterior 
que dos líneas por el origen generan un plano. 


Notación. A veces será más fácil referirnos a los puntos de PP? por una sola 
letra como p o q; en este caso, sabemos que podemos recurrir a sus coordenadas 
homogéneas o a algún vector representante, pero en el contexto éstos no son relevantes. 
También será útil tener una notación para la recta que generan 


dos puntos: (pa) 
p 


denotará la recta que pasa por p y q. Así que hemos demostrado que si [a] 4 [b] 
entonces 


(Lal, [b]) =liaxb)- 


...Dibujo 
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Obsérvese también que las dos demostraciones anteriores son casi la misma, y esto 
no es casualidad. Se debe al principio de dualidad (6.12) que nos permite traducir 
cualquier resultado a su versión dual intercambiando “recta” por “punto” y la relación 
“pasar por” por la de “estar en”. Pero de esto hablaremos más adelante con ejemplos 
más interesantes a la mano. Por el momento queremos insistir en la diferencia básica 
con el plano euclidiano. 

En el plano euclidiano se cumple el Lema 6.7, pero no el 6.8. De hecho este 
último contradice al Quinto Postulado; establece que en el plano proyectivo no hay 
paralelismo, que cualquier par de rectas se comporta de la misma manera: se inter- 
sectan en un único punto. 


EJERCICIO 6.26 Sean [a] = [1:0:—1], [b] = (2:1:—1], [e] = [0:1:—1] y [d] = 
[1 : —1:3]. Encuentra el punto de intersección de las rectas que pasan por [al y [b] y por 
[e] y [dl; es decir 

(la, [b]) A (lel, [d)) . 
EJERCICIO 6.27 Los cuatro puntos del ejercicio anterior generan seis rectas cuyas 
intersecciones dan siete puntos. ¿Cuáles son los dos que no hemos dado explícitamente? 
EJERCICIO 6.28 En el plano z = 1 de R3 puedes encontrar representantes de los 


puntos del Ejercicio 6.26; haz un dibujo en él (como papel con coordenadas x, y) de los 
objetos mencionados en los ejercicios anteriores. 


6.4.4 Parametrización de rectas proyectivas 


En el plano euclidiano, toda recta es copia de la recta real mediante una parame- 
trización. Veremos ahora el análogo: que en el plano proyectivo toda recta es una 
copia de la recta proyectiva. 

Dados los puntos [a], [b] e P?, tales que [a] 4 [b], tenemos una parametrización 
de la recta que pasa por ellos dada por la función 


p! 23 m2 


x:yl > [xa+uybl; 


que corresponde a la manera natural de generar un plano por dos vectores dados. 
Esta función es inyectiva y nos dice que cada recta del plano es como la recta proyec- 
tiva modelo, o abstracta, P!. Sin embargo no está unívocamente determinada por 
los puntos [al y [b] (aunque sí por sus representantes a y b). Si tomamos ta en 
vez de A, con t % 0 por supuesto, entonces la asignación [x: y] => [x (ta) + yb] 
sigue mandando al [1 : 0] en [a] y al [0 : 1] en [b], pero en el resto de los puntos es 
diferente (si t 4 1). Esto corresponde a que una transformación proyectiva de P! está 
determinada por su valor en tres puntos, no sólo en dos. Así que dado cualquier otro 
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punto [e] € A. al, [b]) se tiene que ec =ta-+sb para algunos t y s que son distintos 
de cero si [a] 4 [c] 4 [b]. Y entonces la función 
Pp > Pp? 


x:yl > [x(ta)+y(sb)], 


que manda a la terna canónica [1 : 0], [0: 1],[1 : 1] en la terna [a], [b],[c] sí está 
unívocamente determinada. 
Estas inclusiones de IP! en P? son ejemplos de funciones proyectivas. Tenemos 


entonces que todas las rectas de IP? son como nuestro modelo ideal de recta proyectiva 
P. 


EJERCICIO 6.29 Sean [a] =[1:0:—1],[b] =[2: 1: —1] y [e] =[0: —1 : 0]. Demuestra 
que son colineales y encuentra explícitamente la función proyectiva de P! en P? que manda 
al [1 : 0] en [a], al [0 : 1] en [b] y al [1 : 1] en [e]. 


EJERCICIO 6.30 ¿Puedes definir líneas en P3? ¿Funciones proyectivas de P? en P9? 


6.5 Modelos del plano proyectivo 


6.5.1 Completación de IR? 


Consideremos al plano en I¡R* dado por la ecuación z = 1; llamémosle M,. Tiene una 
parametrización natural tomando como origen al tercer vector canónico €z y como 
generadores a ey y ez; es decir, lo podemos identificar con R2 mediante la inclusión: 


RE == 1 Er 
(54) + ul 


Consideremos también al siguiente conjunto de P?: 
Al=lku:dePl20l. 


Consiste de todos los puntos de PP? que no cumplen z = 


0; es decir, es el complemento en el plano proyectivo de 
la recta L¡e,); esto es, Az = P2—ffe,¡. Entonces, tenemos 
una biyección natural 


TT > A, 
(xy, 1) +=» [x:y:ll, 


cuya inversa, que está bien definida, es 
A, => Tl 
x:y:zl > (x/z,y/z,1l). 
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Si pensamos a los puntos de 1P?, geométricamente, como rectas por el origen en 
R?, entonces A, consiste de todas estas rectas excepto las horizontales (en el plano 
z =0, que corresponden a puntos de f¡e,¡). Cada una de las rectas [x] € A, intersecta 
a TM, en un único punto. Y ésta es la biyección Az —> Tz, (Ix] > lx] A TT). 

Componiendo las dos biyecciones que acabamos de definir, podemos identificar a 
R? con el complemento de una recta en P?: 


RS A, =P? — fio] (6.13) 
(xy) o lx:y: 1]. 


A esta inclusión de R? en el plano proyectivo se le llama una carta coordenada (pues 
da coordenadas locales para un pedazo de P?), y a ésta en particular la llamaremos 
la carta coordenada canónica. Observemos además que las rectas por el origen en 
R* cercanas a las horizontales intersectan en puntos muy lejanos al plano TI, y, por 
tanto, corresponden a puntos de norma muy grande en R?. De tal manera que si a 


R? le “pegamos” una recta proyectiva al infinito (llamémosla Ll. = le,) obtenemos 
pz 


y) 


P? =R?UL,. 


Veamos ahora que las rectas de R? y de P? se corresponden. Una recta l en IR? 
está dada por una ecuación ax + by =C: 


l=£(x,y) ER? | ax+by =c). 


Por (6.13) sus puntos van a los puntos de la recta dual 
a la: b:—c]: 


[lx:y:zl EP |ax+by=cz=0), 


y al único punto que no le “pegan” es a [—b: a: 0]; que es justo la intersección de 
esta última recta con la recta al infinito. 

Geométricamente, una recta en R? pensado como TI, genera junto con el origen 
(de R*) un plano que corresponde a una recta en 1P?; lo único que no se “ve” en Tl, 
es la intersección de ese plano con el plano horizontal (z = 0), que es [—b: a: 0]. 
Obsérvese además, que las rectas paralelas en R? (obtenidas al variar c en la 

...Dibujo descripción anterior) pasan por el infinito en este mismo punto. 

Inversamente, una recta en P? corresponde a un plano por el origen en R*, y todos 
ellos, excepto el horizontal (z = 0), intersectan a TT, en una recta. 

Podemos resumir diciendo que el plano proyectivo se obtiene del euclidiano aña- 
diendo un punto al infinito por cada clase de paralelismo de rectas. Las rectas del 
proyectivo son las rectas del euclidiano a las que se adjunta el punto al infinito de 
su clase de paralelismo (convirtiéndolas en rectas proyectivas), y además, todos los 
puntos al infinito constituyen una nueva recta, llamada “la recta al infinito”. 
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6.5.2 Cartas afines 


D2 


En la sección anterior demostramos que se puede ver como R? junto con una 
recta al infinito £.. Podría parecer que esta recta tiene algo especial, pero no es asi. 
Escogimos la tercera coordenada para definir el plano TT, C R* y el subconjunto A, de 
P2 por conveniencia. Podemos usar la segunda coordenada y para definir TT, : y = 1; 
Ay := [lx:y:z] €P?| y 40], de tal manera que Ay = P* — ([e,; y tenemos una 
nueva carta coordenada 


R > A, 
(x,z) > lx:1:zl, 


cuya inversa es 


Ay = R? 
Ix:y:zl H= (x/u,z/y). 


En esta nueva carta coordenada, lo que antes era la recta al infinito se ve como el 
primer eje coordenado de R?, es decir, corresponde a la recta Lx, Ze R?|z= 0»; 
el origen de R? corresponde al punto [0: 1: 0] = [e], y lo que ahora no se ve (la 
nueva recta al infinito) es su dual (l;.,;. Si pensamos a estas cartas coordenadas como 
fotografías de porciones grandes de P?, con estas dos cartas hemos retratado a todos 
los puntos, con excepción de uno: [1 :0: 0] = [e], que en ambas cartas quedó en el 
infinito. Pero debe ser claro ahora que si hacemos lo mismo con la primera coordenada 
x, obtenemos una nueva carta IR? — A, =P? — l¡2,¡ con coordenadas naturales (y, 2), 
donde [e¡] aparece justo en el origen. 


El nombre de “carta” que hemos estado usando impunemente, ahora sí cobra 
sentido: viene de la palabra antigua para referirse a “mapa”. Y con las tres cartas 
que hemos definido armamos un atlas que describe a todo el plano proyectivo. Nos 
dice que el plano proyectivo es localmente como el euclidiano y las rectas de 
ambos se corresponden (también localmente). 

Hemos usado el apellido “coordenada” para las cartas, pues son funciones explí- 
citas de R? en P? que nos dan coordenadas locales al quitar una de las tres rectas 
lie,- Pero, además de su sencillez analítica, no hay nada de especial en estas tres 
rectas. La idea funciona para que cualquier recta se vaya al infinito, pero entonces lo 
que nos queda no tiene coordenadas naturales (para hacerse corresponder a IR?) pues 


no habrá origen ni ejes canónicos. Veamos. 
2 


Dada una recta ln; E P* consideremos el plano TT, : n-x = 1 (el 1 podría cambiarse 
por cualquier constante distinta de cero, pero así será más fácil pues cambiar al 1 
corresponde a alargar n). Cualquier recta por el origen [x] € P? que cumpla que 
[x] E lin (es decir, que n - x % 0) intersecta a TI, justo en un punto. A saber, en 


(nx) lx. De tal manera que TI, puede identificarse con P? — lin; por medio de la 


...Dibujo 


...Dibujo 


AN 
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función 


Ta > P? — Li 
x * lx. 


Puesto que TT,, es un plano afín (no tiene coordenadas naturales), a ésta la llamamos 
carta afín. Lo cual implica que cualquier recta de IP? funciona como recta al infinito 
en la carta afín que abarca a su complemento. 


Como ejemplo importante, veamos al plano que contiene a los tres vectores canóni- 
cos. Sea u = (1,1,1), y sea TT: u.x = 1. Es decir, T está dado por la ecuación 
x+y+z= 1. De tal manera que e; € MT parai= 1,2,3. 
Además forman un triángulo equilátero con (1/3)u en 
0 el baricentro. Este plano contiene a un representante de 
L> puta) cada [x: y : z] € P? que cumpla x+y +2 % 0; a saber, 
(x/(x+y+2),u/(x+y+2),2/(x+y+2)). Esta carta afín 
es simétrica respecto a las tres coordenadas; las rectas 
al infinito de las tres cartas coordenadas que vimos al 
[o:0:1J— (01 t:o:0] principio son ahora las rectas del triángulo básico. Nos 
será útil más adelante; entonces nos referiremos a ella 
como la carta afín canónica. En ella también se ve la “loseta canónica” (los puntos 
(0,0),(1,0), (0,1), (1, 1) de la carta coordenada canónica) y los siete puntos en que 
se basó el trazado de pisos del pintor. Nótese que al poner coordenadas proyectivas 
ya no nos preocupamos de que las coordenadas sumen 1, pero que a partir de ellas, 
las coordenadas baricéntricas correspondientes se obtienen fácilmente. 


[0:1:1] [1:1:0] 


EJERCICIO 6.31 Describe la intersección de dos cartas afines. 


EJERCICIO 6.32 Sea 3 : R? — P? la carta coordenada canónica como función, es 
decir 

p3(x,y)=|x:y: 1). 
Análogamente, sean 2,1 : R? —> P? las cartas coordenadas de la segunda y primera 
variable respectivamente. ¿Cúal es la expresión analítica de p>' o (p3? ¿En dónde está 
definida? A estas funciones se les llama cambio de coordenadas, pues en un atlas indican 
cómo interpretar puntos en una carta (mapa) dentro de otra. 


EJERCICIO 6.33 En la carta afín canónica localiza los puntos 
2:0:11,3:0:11,10:2:1],[1:0:2] y [1:1:—1]. (Recuerda la sección de coordenadas 
baricéntricas). 


EJERCICIO 6.34 En la carta coordenada canónica, ¿cuál es la recta al infinito de la 
carta afín canónica? 
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6.5.3 La esfera módulo antípodas 


Otra manera de “ver” al plano proyectivo es usando a la esfera unitaria S?. Puesto 
que cada recta por el origen en R* intersecta a la esfera en dos puntos antípodas, a 
saber, 


-1 -1 
xd A1s*= Lx x, — [xl lA 
entonces la función 


s > Pp? 
x > lx 


es sobre y 2 a 1. Es decir, la pre-imagen de cada punto consiste precisa- 

mente de dos puntos; y en nuestro caso esos dos puntos son antípodas 

(pues [x] = [—x]). Dicho de otra manera, la esfera unitaria S? contiene 
representantes de todos los puntos de IP?; más aún, contiene exactamente dos repre- 
sentantes de cada uno y éstos dos son antípodas. Si consideramos “ser antípodas” 
como una relación de equivalencia en S?, entonces IP? es el conjunto de clases de 
equivalencia. Esto se escribe como 


P? =8S?/[x uu —x) 


y se lee “P? es igual a S? módulo antípodas”. Más aún, como las clases de equivalencia 
consisten de parejas de puntos muy alejados (de hecho tan alejados como es posible), 
entonces en porciones pequeñas de la esfera (que no contengan una pareja de antípo- 
das) la correspondencia es 1 a 1. Se dice entonces que la esfera es un cubrimiento 
doble del plano proyectivo. 

Si con las cartas afines hicimos el símil de una fotografía fiel pero local (de un 
pedazo) de P?, ahora tendríamos que decir que este modelo es una foto global, pero 
sobreexpuesta (aunque con control: cada punto aparece dos veces en la foto y justo 
en extremos opuestos de ella). 

Éste será el modelo adecuado para hablar de cuestiones métricas en el plano 
proyectivo. Observemos que las rectas de 1P?, al corresponder a planos por el origen 
de R3, se “levantan” a círculos máximos en S?. Al recorrer un círculo máximo en 
S? para regresar al punto de partida, se recorre “abajo”, en P?, una recta pero se le 
dan dos vueltas (al llegar al punto antípoda en S? ya llegamos al punto de partida 
en P? y arrancamos una nueva vuelta). Cada círculo máximo se mapea 2 a la 
su recta correspondiente en el proyectivo. Tenemos entonces que las maneras más 
económicas (o rápidas) de viajar en S?, que son los círculos máximos, corresponden a 
las rectas de P?. Lo cual indica que debe haber nociones de distancia y ángulo en el 
plano proyectivo si los copiamos de su cubierta doble. Esto se hará con detalle más 
adelante; por lo pronto queremos dejar la idea de que hay un proyectivo rígido, con 
nociones métricas y que localmente parece un cascarón esférico. 
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6.5.4 Modelo del disco 


Del modelo de la esfera podemos obtener uno nuevo como sigue. Consideremos el 
hemisferio superior de la esfera 


5 :=]luzmes > 0. 


De nuevo, S? tiene representantes de todos los puntos de P?, ¡.e., la función x + [x] 
restringida a S? es sobre. Pero ahora es 2 a 1 solamente en la frontera, es decir, en 
el ecuador (cuando z = 0), que corresponde a la recta al infinito de nuestra carta 
coordenada canónica z = 1. Pues cada punto que no está en la frontera de s tiene 
su tercera coordenada positiva, z > 0, y entonces su antípoda la tiene negativa, y por 
tanto ya no está en Sa Si proyectamos ortogonalmente al hemisferio superior sobre 
el plano z = 0, obtenemos una biyección con el disco unitario en R?, 


Y := (y) ER 4 yo< 1, 


cuya frontera es S'. En topología, se usa al símbolo de “parcial”, 9, para denotar la 
frontera, y se lee “frontera”, así que podemos escribir lo anterior: 
? El 


9D? =S'. 


Y podemos concluir que el plano proyectivo se obtiene del disco D? identificando cada 
punto de la frontera con su antípoda, que se escribe 


P?=D"/[(x=-x|xesS'p. 


A éste lo llamaremos el modelo ortogonal del disco. Tiene la desventaja de que las 
rectas proyectivas, excepto la del infinito y las que pasan por [ez], se proyectan en 
elipses, y que en la recta al infinito distorsiona mucho pues ahí la proyección ortogonal 
colapsa la dirección vertical. Esto se corrige cambiando de proyección. 

La proyección estereográfica de la esfera consiste en proyectar desde 
ez el polo sur, —e3, al plano z = 0; es decir, a cada punto x € S? lo man- 
damos a la intersección de su recta con —€e3 y el plano z = 0. Es claro 
que al hemisferio superior lo manda en el disco unitario (y al inferior 
a su exterior, pero esto no nos interesa). Resulta que la proyección 
estereográfica (de S? — (—ez) en ¡R?) preserva ángulos y manda a las 
líneas esféricas en círculos que intersectan a S' en puntos antípodas. 
No demostramos lo anterior pues formalmente nunca lo necesitaremos, 
pero es un buen ejercicio de geometría en el espacio; aunque son las dos 
propiedades que hacen preferible a la proyección estereográfica sobre la ortogonal. 


3 


Xx 
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El modelo del disco (ya sin apellido, o modelo estereográfico del disco, si 

XK queremos ser más explícitos) se obtiene del hemisferio superior Sí proyec- 
tando estereográficamente sobre D?, y entonces P? es este D? identificando 

puntos antípodas en la frontera (Lx =—x|Ix es! »). Se tiene además que las 

rectas proyectivas son segmentos de círculo que intersectan a S' en puntos 
antípodas (incluyendo los diámetros como círculos con centro en el infinito). 

Tiene la agradable particularidad de que los ángulos sí se pueden medir en 

él, aunque las distancias no. 


EJERCICIO 6.35 En un pedazo de tela redondo (- D?), un mantelito digamos, zurce la 
orilla (3D?) de tal manera que cada punto quede pegado a su antípoda. ¿Se puede concluir 
este trabajo? 


EJERCICIO 6.36 Observa que en el modelo del disco sólo se usa el plano y subconjuntos 
de él. Describe el análogo del modelo del disco para P*. 


EJERCICIO 6.37 Demuestra que la proyección estereográfica f : S? —[—e3z) — R? tiene 
la fórmula analítica 


f (x,y,z) = (x, y). 


z+1 


EJERCICIO 6.38 Demuestra que bajo la proyección estereográfica la línea esférica 
dada por la ecuación ax + by + z = 0 se mapea en el círculo con centro en (a,b) y radio 
va? + b2? +1. ¿Qué líneas esféricas no caen en el enunciado anterior y a dónde se mapean? 


6.5.5 La banda de Moebius más un disco 
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El ejercicio de zurcir el mantelito tiene respuesta negativa; no hay manera de ver 
al plano proyectivo como subconjunto de RY%. Pero sí podemos verlo en dos peda- 
zos. Si del disco D? cortamos un disco interior, el 


de radio 1/2 digamos, y llamémoslo Df /2, Obtenemos 
(O) _ Ó a un anillo y un disco (de los cuales hay que recor- 


dar que —y cómo— sus fronteras se identifican). En 

el anillo, además tenemos que identificar la frontera 
exterior antipodálmente para obtener el plano proyectivo, y esto se puede lograr 
haciendo un nuevo corte que nos da una banda; luego, dándole media vuelta a una 
mitad (estirándola), al mismo tiempo que 
vamos haciendo un giro (en R3) que pase 
lo de adentro hacia afuera para identi- 
ficar el primer par de antípodas. Y de ahí 
en adelante, seguir identificando es como 
cerrar un zipper: la banda tiene que dar 
otro giro de TT para regresar justo a pe- 
garse con el extremo que se había quedado 
fijo y untado al plano. Obtenemos una 
banda de Moebius M. La frontera de la 
banda de Moebius es un círculo (se es- 
cribe, topológicamente, IM = S') que 
debe identificarse con la frontera de D? ¡2 que también es un círculo. Podríamos 
resumir con una fórmula topológica del estilo 


“Pp = DU, M” 


pues el disco D? y es “igual” al canónico D? y tanto él como la banda de Moebius 
M tienen la misma frontera, S', que se identifica; es una unión donde se “comparte” 
la frontera. El entrecomillado es porque no nos toca dar definiciones más precisas. 
Varias observaciones son pertinentes. 

Primero, obsérvese que el círculo que originalmente era la frontera exterior del 
anillo viene de una línea proyectiva, la del infinito; al hacer la identificación antipodal 
quedó justo como una línea (punto por punto, sin redundancias, pues los puntos que 
debían identificarse lo hicieron), y es el corazón, alma o ánima de la banda de Moe- 
bius. Puesto que todas las líneas son iguales, debemos tener entonces que alrededor 

de cualquier línea proyectiva, su “vecindad regular”, que se obtiene 


un diámetro digamos en el modelo del disco, se obtiene el mismo 

resultado; es decir, córtese una vecindad regular de un diámetro, 

quedan tres pedazos, en ellos se pueden hacer las identificaciones 
de la frontera y nos queda, como era de esperarse, una banda de Moebius (con el 
diámetro como ánima) y un disco cuyas fronteras deben identificarse. 


alejándose un poquito en las dos direcciones normales a ella, tam- 
/) bién hay una banda de Moebius. Si hacemos esto con otra línea, 
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Segundo, recuérdese que en la sección última (y extra) del Capítulo 1 (si se pasó 
por alto, hojéese) ya habíamos obtenido una banda de Moebius abierta como el espacio 
de rectas en I¡R?. Esa banda de Moebius abierta es justo el plano proyectivo quitándole 
un punto, pues las rectas en R? son las proyectivas menos la del infinito, y las rectas 
proyectivas corresponden, por dualidad, a los puntos de 1P?; esa banda de Moebius se 
obtiene haciendo chiquito al disco complementario. 


Y tercero: el plano proyectivo no es orientable. Si un punto vi- 
aja por el ánima de una banda de Moebius junto con una base de 
vectorsitos, el primero apuntando en la dirección del movimiento y el 
segundo perpendicular a la izquierda (lo que hemos convenido como 
orientación positiva), al dar una vuelta el primer vector regresa justo 
a su lugar, pero el segundo apunta en la dirección contraria. No hay 
manera de dar orientaciones locales de manera coherente en toda la 
banda de Moebius y por eso se dice que es no orientable. Pero esto 
también tiene sus ventajas, y podemos mover a la banda de Moebius dentro de sí 
misma —empujándola junto con el punto, trasladando en la recta que es su ánima— 
y al dar una vuelta completa, el efecto local es como si reflejáramos en la línea, la 
frontera sólo ha dado media vuelta dentro de sí misma. Esto se verá con más cuidado 
al estudiar las transformaciones del plano proyectivo. 


EJERCICIO 6.39 |[“Toro”] 


“Toro” Se pueden identificar los lados opuestos de un cuadrado de tres maneras esencial- 
mente distintas como en la figura. La primera da la superficie (la frontera) de una dona, 
que en matemáticas se conoce como toro. La segunda da la botella de Klein, ¿qué da la 
tercera? ¿Cuáles se pueden ver en R$? ¿Cuáles son orientables? 


> > > 


6.5.6 Modelo Nintendo 
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Muchos juegos de computadora o Nintendo en los que el objeto que controla el jugador, 
una navecita digamos, se mueve libremente en dos dimensiones, tienen la particulari- 
dad de que cuando la nave llega a un extremo de la pantalla aparece justo por el lado 
contrario. En estos juegos, el “espacio” (virtual por necesidad) donde vive la nave 
es un Toro (véase el ejercicio “Toro”). Podemos entonces diseñar un juego equiva- 
lente donde el espacio sea el plano proyectivo, tomando como “cancha” un disco y 
haciendo que cada vez que la navecita choque 
con la frontera aparezca continuamente por la 
parte opuesta. 

La navecita tiene la particularidad de ser 
simétrica con respecto a un eje, así que la cam- 
biaremos por un ser bidimensional que no sea 
simétrico; que tenga una mano pero la otra no, 
un “manquito”. Si sale del centro del disco, 
cruza la frontera (él ni cuenta se da de que lo 
está haciendo) y regresa al centro, ahora está 
manco de la mano contraria. No se puede de- 
cir, por tanto, si es manco de la mano derecha, 
o de la mano izquierda. Esto sucede porque el plano proyectivo no es orientable; 
localmente sí se puede hablar de derecha e izquierda, pero globalmente pierden su 
sentido. Al dar una vuelta “esencial” por su universo, el manquito ve todo como en 
espejo; pero no es tan grave, una vuelta más y todo regresa a la normalidad. 


EJERCICIO 6.40 ¿Es orientable P3? 


EJERCICIO 6.41 —Supón que nuestro universo es no orientable. ¿Cuál sería el efecto 
sobre ti de un viaje intergaláctico que regrese a la Tierra pero con la orientación opuesta”? 
¿Sabrías leer? 


6.6 Transformaciones proyectivas 


Hemos insistido en que un enfoque moderno en geometría debe incluir por fuerza un 
estudio de las transformaciones relevantes. Nos toca entonces estudiar las transfor- 
maciones del plano proyectivo en sí mismo que preservan la estructura que hemos 
definido, sus subconjuntos especiales llamados rectas. 


6.6.1 Con regla 


Recordemos la sección donde se construyó el método del pintor para que, con el simple 
uso de una regla (y lápiz y goma, por supuesto), se pudiera dibujar un piso cuadric- 
ulado en perspectiva. Ahora podemos decir mucho más cosas sobre ese método. 
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Si pensamos en el piso como ¡R? junto con una línea al infinito, es decir, como 
P?, y al lienzo también como IP? (o una porción de él), entonces estabamos rastre- 
ando, o construyendo, una función de IP? en sí mismo que manda rectas en rectas 
a partir de la imagen del cuadrado unitario o “loseta básica”. La construcción se 
hace totalmente general cuando sabemos que cada par de rectas se intersectan, pues 
de las dos (imagenes de las) horizontales definimos su intersección, oo,; de las dos 
verticales el correspondiente coy; a partir de estos dos puntos (que son diferentes 

pues las intersecciones de unas y otras son los vértices de la 
Se Sen loseta) encontramos la imagen de la línea al infinito (que en 


aquel entonces llamamos horizonte), etc. Solamente se están 
usando los lemas de incidencia y que la función manda rectas 
en rectas. 


Inclusive se puede definir a dónde se mandan cuadrículas 
más finas al considerar la otra diagonal de la loseta, y tomar 
la intersección de ambas diagonales que debe ser la imagen 

del centro de la loseta original; a partir de este punto trazamos nuevas horizontales y 
verticales y el mismo proceso nos definirá a dónde van las losetitas. Para efectos de 
un pintor, se puede entonces aproximar (usando cuadrículas más y más finas) tanto 
como él quiera a una perspectiva perfecta de lo que esté dibujado en el piso. Y con 
variaciones o aplicaciones del mismo método a otros planos (fachadas, etc.), bastará 
para buenas reproducciones del mundo tridimensional sobre un lienzo. Pero para 
nosotros no basta. 


Da la impresión de que este método tiene como corolario que para cualquier 
cuadrángulo (la loseta originalmente pintada y bastante arbitraria por cierto), habrá 
una transformación de P? en P? que manda rectas en rectas, y al cuadrado unitario 
en el dado. Este teorema es cierto, pero en su demostración por métodos sintéticos se 
involucran resultados fuertes, entre otros los teoremas de Desargues y de Papus (que 
tienen que ver con el problema de colinearidad que se planteó entonces), y también 
surge un problema profundo de completez. Pues para nada es claro que a cualquier 
punto lo podamos definir con una simple regla y un compás; tendríamos que invocar 
continuidad, que nos rebasa. 


Pero las cosas no están tan mal como las estamos pintando. Hemos construido un 
poderoso método analítico con el que resolveremos las interrogantes planteadas. 
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EJERCICIO 6.42 Dadas las imágenes de los cuatro vértices de una loseta como en las 
figuras siguientes, completa a dónde tienen que ir las ocho losetas circundantes bajo una 
transformación proyectiva (que preserve líneas). 


1 2 3 
de C e de É 
. de 
á * Qe eb de eb 
a 
4 5 6 
Co m7) de de 
Q E 
. ú o 
ar el E de eb 


EJERCICIO 6.43 Añade a las figuras anteriores la horizontal y la vertical que parten 
a la loseta en cuatro losetitas iguales. 


6.6.2 Analíticas 


Una transformación de IP? en P?, pensando a sus puntos como rectas por el origen en 
R?, nos dice cómo mandar a estas rectas en ellas mismas, define una correspondencia 
entre ellas; si además le pedimos que mande rectas proyectivas en rectas proyectivas, 
la correspondencia entre rectas deberá mandar planos por el origen en planos por 
el origen. Y de este tipo de transformaciones en R* ya hemos hablado. Tenemos 
las transformaciones lineales de R? que cumplen justo estas propiedades, mandan al 
origen en sí mismo, a las rectas por él en rectas por él y a los planos por el origen en 
planos por el origen. ¡Ni mandadas a hacer! 

Sea A una matriz invertible de 3 x 3, que define una transformación lineal de R* 
en R* dada por la regla de correspondencia x => Ax para todo x € ¡R*. Podemos 
entonces definir su transformación proyectiva asociada como 


fa: PP 
fa (lx]) = [Ax]. 


Para ver que está bien definida, hay que ver que la imagen está en donde debe y que 
no depende del representante. Puesto que [x] € P? implica que x 4 0, y esto a su vez 
que Ax % O pues escogimos a A invertible, entonces [Ax] € P?. Además, dada t 4 0, 
se tiene que 

fa ([tx]) = [A(tx)] =[t(Ax)] = [Ax] = fa (lx]) . 


6.6. TRANSFORMACIONES PROYECTIVAS 285 


Por tanto fa está bien definida y manda rectas en rectas, pues éstas corresponden a 
los planos por el origen en R* y A manda planos por el origen en planos por el origen. 

Es facil ver que estas transformaciones forman un grupo pues las matrices inver- 
tibles (o las transformaciones lineales) lo hacen (veáse, y hágase el Ejercicio 6.44). 
Definimos entonces el grupo de transformaciones proyectivas de P?, o de proyectivi- 
dades, como 


Pr(2) := [fa : P2>P?]|A € GL(3)). 


Por la definición, parecería que Pr(2) está en correspondencia con GL(3), pero no 
es así. Muchas matrices definen la misma función. Por ejemplo, si tomamos t 4 0 
entonces tA € GL(3) y se tiene que 


[(t A) x] = [t (Ax)] = [Ax] 


para todo [x] € P?. Así que fa = fia, y se valdría de nuevo hablar de fía; := fa como 
nos sucedió con las rectas. Lo que sí hay es una función de GL(3) sobre Pr(2), que 
por preservar el producto se llama homomorfismo. Y lo que sería bonito demostrar 
es que dos funciones proyectivas son iguales sólo si sus matrices son proyectivamente 
equivalentes, es decir de la forma A y tA para t 4% 0. Pero esto se verá en la siguiente 
sección. 


EJERCICIO 6.44 Demuestra que Pr(2) es un grupo de transformaciones. 
EJERCICIO 6.45 ¿Cómo definirías Pr(3)? 


6.6.3 El Teorema de 4 en 4 


Decimos que un conjunto de puntos en el plano proyectivo está en posición general si 
ninguna tercia de ellos es colineal. 


Teorema 6.9 Sean Po,P1,P2,P3 Y do, 91,42, 43 dos cuartetas de puntos en P? en 
posición general. Entonces existe una única transformación proyectiva f € Pr(2) que 
manda una en la otra, es decir, tal que f(p,) = q; parai=0,1,2,3. 


Demostración. Como ya hemos visto en la demostración de los teoremas análogos, 
bastara demostrar que una cuarteta determinada puede ir a cualquier otra (ver y hacer 
el Ejercicio 6.46). Como cuarteta determinada, claramente nos conviene escoger a la 
cuarteta canónica [es], [ey], [e,] , [ez] donde e, e», ez son la base canónica de R*, y 
€o = M1) =€e1+e2+€g3. 

Sea do, 1, 42, 43 una cuarteta de puntos cualquiera en en posición general. 
Tenemos entonces que q; = [u;] para algún vector u; € R3. Es muy fácil lograr que 
la base canónica vaya a donde debe. Sea, 


D2 


1 
A = (u;,u),, uz) 
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la matriz 3 x 3 que cumple A'ey =u¡, A'e, =u) y A'ez =u3. Que [uy], [u>] y [uz] 
no sean colineales en P? implica que los vectores U1, U2 y Uz no son coplanares en R* 
y, por lo tanto, que la matriz A' es invertible. Entonces su función proyectiva asociada 
f'está bien definida y cumple que f' ([e,]) = [ur], f ([e2)) = [uz] y f ([ez)) = [uz], 
pero su valor en [e/] no tiene por qué ser [u¿]; por eso hemos usado las primas, todavía 
no es la buena. 

Observemos que aún podemos modificar a A” de tal manera que los puntos de la 
base canónica vayan a dónde deben, a saber, si multiplicamos una columna por una 
constante no cero. Por ejemplo la matriz 


A” = (tu;, uz, uz) 


cumple que [A” e] = [tu] = lu¡] (aunque ya no sea cierto que mande al vector 

e, en el vector u¡). De tal manera que todavía tenemos tres grados de libertad para 

modificar a A” multiplicando sus tres columnas por constantes distintas de cero. 
Como u;, u> y uz forman una base de R3, existen constantes A1, Az y Az tales que 


u = Mu; + Au) + Azuz. 
Sea A (ahora sí la buena) la matriz 
A = (Muy, uz, A3u3). 


Puesto que [u¿] no es colineal con [uz] y [uz], entonces Uy no es coplanar con uz y 
u3, y por lo tanto A; 4 0. Análogamente, A, 4 0 y Az 4 0, y por tanto det(A) = 
MA2A3det(A') 4 0. Lo cual nos dice que A € GL(3) y tiene una transformación 
proyectiva asociada f = f1 que cumple 


y por tanto demuestra la existencia. 

Para demostrar la unicidad, de nuevo (por las propiedades de grupo) basta demostrar 
un caso particular (ver y hacer el Ejercicio 6.47). Supongamos que f € Pr(2) es tal 
que f([e;]) = [e;] para i =0,1,2,3. Sabemos que f está dada por una matriz 


A = (v,v2,v3). 


Puesto que [e] = f(le¡]) = [Ae1] = [v;], entonces existe t;¡ 4 0 tal que v; = t,€3; y 
análogamente existen t2 4 0 y t3 4 0 tales que vz = t2€> y v3 = t383; es decir, A es 
una matriz diagonal. Pero se tiene además que 


[1:1:1] =[e0] =1 (leo) =[Aeo] = [t: :t2 : tz), 
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lo cual implica que t1 = t2 = t3 =t. Por tanto 


t00 
A=| 0 tt 0 | =1tl 
0.0 t 
y esto, como ya hemos visto, implica que f = f¡ = idp». O 


De este teorema y su demostración obtendremos, por lo pronto, dos implicaciones. 
La primera es que el método del pintor que hemos descrito es coherente. Pues si las 
cuatro esquinas de la loseta inicial están en posición general, entonces existe una 
transformación proyectiva, dada analíticamente, que manda a todo IP? en sí mismo y 
que manda rectas en rectas (preservando por tanto colinearidad y concurrencia), de 
tal manera que el método constructivo que describimos es obligado. 

La otra implicación es concluir la descripción del grupo Pr(2) en términos de ma- 
trices. Si declaramos que dos matrices A y B son equivalentes cuando existe t 4 0 tal 
que B=tA y denotamos con [A] a la clase de equivalencia de A, entonces las trans- 
formaciones proyectivas están en correspondencia natural y biyectiva con el conjunto 
de clases de equivalencia de matrices invertibles, es decir, con ([A] | A € GL(3)); que 
a veces se llama GL(3) proyectivizado y se le denota PGL(3). 


Ejemplo 


Para fijar ideas, veamos un ejemplo concreto. Queremos expresar 
analíticamente la transformación proyectiva de IR? en IR? (pensados 1 
como la carta coordenada canónica de PP?) que hace lo siguiente 


(0,0) => (0,0) 
(1,0) > (2,1) 
(0,1) > (1,2) 
0D => (1,1). 

Proyectivamente, a cada punto hay que agregarle un 1 a sus coordenadas para 
representarlos con un vector en IR*, pues nos dieron sólo datos finitos, y el problema 
consiste en encontrar una matriz A de 3 x 3 que mande a cada vector en la línea 
generada por el vector correspondiente. Si llamamos a; (i = 0,1,2,3) a los corre- 
spondientes vectores de la izquierda y b;, respectivamente, a los que tienen que ser sus 
imágenes, necesitamos encontrar A tal que Aa; = A¡b; para algunas A; 4 0. Puesto 
que A tiene 9 entradas incógnitas y hemos agregado las A;, tenemos 13 incógnitas en 
total; cada ecuación Aa; = A;b; representa tres ecuaciones lineales donde los datos 
dados proveen las constantes. Así que tenemos 12 ecuaciones lineales con 13 incóg- 
nitas que, en principio, debían tener soluciones a un parámetro, que corresponde al 
hecho de que si A es solución tambien lo es tA para t 4 0. Aunque no es tan difí- 
cil como parece, pues se pueden reagrupar las ecuaciones para hacerse similares por 
grupos, mejor intentemos otro método: siguiendo la demostración del teorema. 
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Sea E la cuarteta canónica ey, e1, €, ez que usamos en el teorema (e;, ez, e3 es 
la base canónica de R3 y ey =e1+e2+ e3). Nos conviene reenumerar nuestros datos 
del dominio para que se parezcan más, de entrada, a €; sean entonces az =(0,0,1), 
as =(1,0,1), a, =(0,1,1) y ay = (1,1, 1) y denotemos con A a la cuarteta ordenada 
A,, A, 47, Az. Respectivamente, sea B la cuarteta by = (1,1,1), b, = (2,1,1), 
b, = (1,2,1) y b3 = (0,0,1). Nuestro problema se parte en dos: encontrar una 
matriz A que mande a la cuarteta € en la A (ojo, esta matriz no es la del parrafo 
anterior) y una matriz B que mande a € en YB. Para, finalmente, obtener la solución 
BA”! que manda a las cuartetas 2 en $: 


y NN, AA 


La matriz (a;, 47, Az) manda a e; en A; para i = 1,2,3; pero sólo nos interesa 
que mande a [e;] en [a;] (los puntos proyectivos o las líneas), y esto lo logran todas 
las matrices (A 41,242,343) con A; 4 0. Así que nos interesa una solución de la 
ecuación 


(A1a,,1242,A303) € = MA) 


para atinarle al cuarto punto. Al sustituir nuestros datos tenemos el sistema 


M = 
M = A 
MEA E A Mos 
cuya solución más bonita es Ap =A¡ =A2 = 1 y Az = —1; que nos da como matriz 
que manda a E en 21: 
10.0 
A=|01 0 
11 —1 


Ya que necesitaremos sacar su inversa, de una vez: resulta que es A, es decir, 
A? =1 (hágase mentalmente el cálculo). Es, en cierta manera, una reflexión y vale la 
pena analizar su comportamiento geométrico antes de proseguir con el ejemplo. 

La matriz A manda a la cuarteta canónica € en la “loseta canónica” 2 y, puesto 
que A? = 1, A manda entonces a la loseta canónica en la cuarteta €; es decir, las 
intercambia. Su expresión analítica como función de R? en R? es 


= Xx E 


(pues se añade un 1, se multiplica por A y se divide entre la tercera coordenada), 
de donde podemos sacar más información o corroborarla. Notemos primero que sus 
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puntos fijos son el punto (0,0) = az y la recta lo : x+y = 2 
(que pasa por Ap), pues son las únicas soluciones de las ecuaciones 
f(x,y) = ([x,y). La recta l; :x+y = l va a la recta al infinito 
lo (que ya sabíamos pues A y Az que la generan lo hacen), pero 
más aún, se intercambia con ella. 


Entonces, si l es cualquier recta que pasa por el origen tenemos 
que f la manda en sí misma por medio de la reflexión proyectiva en 


los puntos £M£, y 0; pues estos se quedan fijos y el punto medio de 
su segmento, £N f;, se intercambia con su punto al infinito LN L.. 
Podríamos decir que f, o equivalentemente A, es la reflexión en la 
recta l, respecto al punto az (= 0); y esto tiene sentido para cualquier recta y un punto 
fuera de ella. Por ejemplo, si tomamos cualquier recta y el punto al infinito en su 
dirección ortogonal, esta reflexión es justo la euclidiana (isométrica), y para cualquier 
otro punto al infinito es una reflexión afín que para reflejar usa una dirección distinta 
de la ortogonal. 

Pero si vemos a f con lupa, muy cerca de O, ahí parece una rotación de ángulo 
TT, pues todas las rectas que pasan por él únicamente cambian de dirección. Y esto 
también es cierto; si tomamos la reflexión en la recta al infinito repecto a cualquier 
punto p, cada recta que pasa por p se refleja en p, simplemente cambia rígidamente 
de dirección, y entonces es la rotación isométrica por un ángulo 7 alrededor de p. 

Después de esta digresión respecto a la matriz A, regresemos a nuestro problema. 
Nos faltaba encontrar la matriz B que mande a la cuarteta canónica en la B. Pero 
ahora al primer tiro cae el gol: la matriz 


PS 


2 1 
B=(b,,b,,b3)=| 1 2 
11151 


cumple que Bb, = 3bo. 

Para entender mejor el efecto geométrico de lo que hace B nos conviene partirla 
en dos movimientos. El primero, que fijando al origen y todas sus líneas (como líneas, 
no punto a punto), trae, jala, a la línea al infinito hasta la línea l3 : x+y = 3, fijando 
punto a punto a la línea f,. Entonces en cada línea l que pasa por el origen tiene que 
ser una expansión de 0 a £M£, y consecuentemente empuja 
a la línea l; hacia l, (y expande a cualquier segmento de 0 a 
l) hacia l,). Esta transformación, donde O sigue “viendo” 
exactamente lo mismo, es una suerte de homotecia desde 
el origen con horizonte en fl, y tiene la matriz 


+ 0-0 
B=| 030 
A 


Y la línea que va a cubrir la línea al infinito es l_7 : x+y = 
—1. 
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Y después hay que componerla con una simple transformación líneal Bz que acerca 
a los dos ejes para llevarlos a las líneas por (2,1) y (1,2). (esta transformación ya 
deja al infinito en su lugar): 


1 210 > 00 
B =B3B¡ = 3 12.0 03.0 
0.03 1.11 
La matriz que buscabamos es entonces 
2 10 10.0 21.0 
BA=| 12 0 01.0 =4 1 2 0 
1.11 11 —1 2 2 —1 


Lo cual en coordenadas de la carta canónica, nos da la función 


1 
f(x,y) = Ra Rae 


En la siguiente figura se persigue a la “loseta” canónica bajo las transformaciones 
proyectivas que acabamos de usar en el ejemplo. 


EJERCICIO 6.46 Demuestra que si existe f € Pr(2) tal que f(a;¡) = q; para i = 
0,1,2,3 para cualquier cuarteta do, 41, 42, 43 de puntos en IP? en posición general, donde 
dy, d;, d7, dz es una cuarteta fija de puntos en P? en posición general, entonces se sigue la 
parte de existencia del Teorema 6.9 
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EJERCICIO 6.47 Demuestra que si es cierto que dada f € Pr(2) tal que f([e¡]) = [ej] 
para 1= 0,1,2,3 implica que f = idp2, entonces se sigue la parte de unicidad del Teorema 
6.9. 

EJERCICIO 6.48 Sean ey =[1:0:0], e, =[0:1:0],ez =[0:0:llyeo=[(1:1: 
1]. Encuentra explícitamente las transformaciones proyectivas que mandan a estos cuatro 
puntos respectivamente en: 


a) [1:0:0], [0:1:0], [0:0:1), [1:1:—1) 
b) [0:1:1) [1:0:1, [1:1:0]),  [1:1:1. 
e) [1:2:21), [-1:1:2], [0:2:1], [22:-—1:3J]. 


EJERCICIO 6.49 En la carta afín canónica (x+y +2 = 1) dibuja la imagen de la línea 
al infinito bajo las transformaciónes proyectivas del ejercicio anterior. 


EJERCICIO 6.50 En la carta coordenada canónica (z = 1) dibuja la imagen de la línea 
al infinito bajo las transformaciónes proyectivas del Ejercicio 6.48. 


6.6.4 Transformaciones afines 


m2 


Puesto que R? se puede ver de manera canónica dentro de P? como la carta euclidiana 
distinguida ((x,y) > [x: y : 11), es natural preguntarse si los grupos de transforma- 
ciones de R? que ya conocemos se pueden ver dentro del grupo de transformaciones 
proyectivas. La respuesta es muy bonita. Sea lo = lie,] la recta al infinito dada por 
la ecuación z = 0 en P?, y sea G el conjunto de transformaciones proyectivas que 
dejan a la recta al infinito en su lugar (la pueden mover punto a punto pero no como 
conjunto). Esto es, 


G=stePr2 mt jeto 


Entonces G es un subgrupo que se identifica naturalmente con el grupo de trans- 
formaciones afines Af(2). Es decir, las transformaciones proyectivas que dejan al 
infinito en el infinito son precisamente las afines (como en el caso de dimensión 1). 
Demostrémoslo. 

Sea A € GL(3) una matriz que representa a f € G (A está bien definida salvo 
constantes no cero). Puesto que [ey] = [1 : 0: 0] € L, entonces f (le,]) = [Ae] € L.,; 
lo cual implica que la tercera coordenada de Ae;, que es la primera columna de A, es 
cero. Análogamente, con e, se obtiene que la segunda columna de A tiene la tercera 
coordenada igual a cero. Si la tercera coordenada de la tercera columna también fuera 
cero, A no sería invertible; lo cual implica (multiplicando por la constante adecuada) 
que podemos suponer que es precisamente 1. Entonces A tiene la forma 


a b 
A=|l| c d 
0 0 


=>0 
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Esta matriz deja fijo (como conjunto) al plano canónico z = 1, pues 


Xx ax+ by+e 
Alu | =|Í| cx+dy+f |], 
1 1 


que claramente corresponde (pensando a IR? como el plano canónico) a la función de 


A O! 


Sea A” la matriz 2 x 2 anterior (el bloque superior izquierdo de A), entonces det(A') = 
det(A) 4 0 y por tanto esta función es una transformación afín. 

Inversamente, para cualquier transformación afín de R? se puede construir una 
mátriz de 3 x 3 como arriba (que resulta ser invertible) y la transformación proyectiva 
correspondiente dejará fija a la recta al infinito (pues manda a le¡] y a lez] en puntos 
de esa recta). Como la recta z = 0 es igual a cualquier otra, hemos demostrado el 
siguiente teorema. 


Teorema 6.10 Dada cualquier recta l de P?, hay un isomorfismo de grupos 


Af2) =[f e Pr 2) 11 (4) =4, 


es decir, las transformaciones proyectivas que fijan una recta se puede identificar con 
las transformaciones afines de la carta afín correspondiente 1P? — (. 


EJERCICIO 6.51 Sea G un grupo de transformaciones de un conjunto X. Demuestra 
que para cualquier subconjunto Y C X, el conjunto de transformaciones que fijan a Y, 


Gy=(feG|f(M =Y, 


es un subgrupo de G. 

EJERCICIO 6.52 En la demostración que dimos ¿a qué matrices de 3 x 3 corresponden 
las transformaciones lineales de R?? 

EJERCICIO 6.53 Considera la carta coordenada canónica Az definida por z = 1 con 
coordenadas naturales (x, y). ¿Cuáles transformaciones proyectivas del Ejercicio 6.48 se ven 
como transformaciones afines en esta carta?. Descríbelas geométricamente. 


6.6.5 *Teoremas de Desargues y de Papus 


En esta sección demostramos dos teoremas clásicos que precedieron, como teoría 
aceptada, a la geometría proyectiva y que entonces la invocan como el hábitat para 
su planteamiento elegante y natural. 
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Desargues es considerado el fundador de la geometría proyectiva 
como estudio sistemático de la “perspectiva”. El teorema que lleva 
su nombre se refiere a parejas de triángulos en perspectiva. Se dice 
que dos triángulos están en perspectiva si hay una correspondencia 
entre sus vértices de tal manera que las tres líneas que unen vértices 
correspondientes son concurrentes. Al punto de concurrencia se le 
llama el foco, y desde él veríamos un solo triángulo (de ahí el nombre 
de “en perspectiva” ). 


Teorema 6.11 (Desargues) Si dos triángulos están en perspectiva, entonces los 
puntos de intersección de sus lados correspondientes son colineales. 


Aunque no hayamos especificado que los dos triángulos viven 
en el plano proyectivo, el enunciado del teorema en sí lo exige, 
pues habla de los puntos de intersección como un hecho. El 
enunciado en el caso euclidiano (recordemos que Desargues no 
sabía aún del plano proyectivo) debería tener varios apartados 
por si alguna pareja, o algunas, de lados correspondientes fueran 
paralelas, y también podría enunciarse para triángulos en per- 
spectiva desde el infinito. De tal manera que, por la posibilidad 
euclidiana del paralelismo, en términos euclidianos clásicos este 
teorema se convierte en una colección de enunciados similares 
con pruebas similares. Desde Desargues, y él sí lo notó, fue un 
teorema en busca de un contexto amplio y general; lo encontró 
en la geometría proyectiva. 

Otro aspecto interesante del Teorema de Desargues es que si se le piensa en di- 
mensión 3 y no 2 (nótese que en el enunciado nunca especificamos la dimensión), su 
demostración es bastante fácil pensando, de nuevo, en términos proyectivos (sin ex- 
cepciones). En el caso en que los triángulos no están en un plano, la hipótesis de que 
están en perspectiva es que sus lados correspondientes son segmentos en las caras de 
un cono triangular, y entonces las líneas correspondientes se intersectan por estar en 
un plano (determinado por un lado del cono). Considérense los dos planos generados 
por los triángulos y sea f su línea de intersección: estos planos intersectan a cada lado 
del cono en los lados correspondientes de los triángulos y entonces f los intersecta en 
su punto de intersección. Así que l es la línea deseada. 

Faltaría el caso en el que todos los planos que se usaron en el argumento anterior 
son uno solo, y podría argumentarse por continuidad “levantando” a la tercera di- 
mensión y luego volviendo a proyectar. Pero mejor seguiremos un camino intrínseco 
que ilustra el juego de la dualidad. 

Recordemos el principio de dualidad que nos permite traducir cualquier enunciado 
o demostración cambiando recta por punto y “estar en” por “pasar por” (o bien usar 
únicamente el concepto incidencia). El Teorema de Desargues es justo un enunciado 
sobre rectas y puntos y su relación de incidencia. Más aún, el dual de su hipótesis es 


...Dibujo 
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precisamente su conclusión. El dual de la definición de estar en perspectiva es: se dice 
que dos triángulos están en perspectiva dual si hay una correspondencia entre sus lados 
de tal manera que los tres puntos de intersección de los lados correspondientes son 
colineales; la recta que los contiene se llama focal. De tal modo que lo que Desargues 
dice es que si dos triángulos están en perspectiva entonces están en perspectiva dual. 
Lo que demostraremos es su dual. 


Teorema 6.12 (Desargues dual) Si dos triángulos en P? están en perspectiva dual 
entonces están en perspectiva. 


Demostración. Ambas condiciones se preservan por trans- 
formaciones proyectivas. Por tanto podemos suponer que la 
recta focal de la perspectiva dual, l, está en el infinito del 
plano euclidiano. Entonces la hipótesis da dos triángulos cuyos 
lados son paralelos. Si son del mismo tamaño, están en per- 
spectiva desde un punto al infinito. Si no, hay una homotecia 
que manda a uno en el otro y están en perspectiva desde el 
centro de esa homotecia. (Esto último también se puede ra- 
zonar analíticamente o por semejanza de triángulos, Ejercicio 6.54). O 


EJERCICIO 6.54 Sean T;¡ y Tz triángulos en R?2 con vértices aj,b,,c1 y a7,b,C2 
respectivamente, y tales que (a1,b1) [| (a2,b2), (b1,c1) || (b2,c2) y (c1,a1) [| (c2, 02); 
donde (p, q) denota la recta por p y q. Demuestra, sin usar transformaciones, que entonces 
están en perspectiva, es decir, que las líneas (az, a2),(b1,b2) y (c1,c2) son concurrentes 


Papus 


En cuanto a su historia, el Teorema de Papus es análogo al de Desargues. Aunque su 
enunciado es un poco más sofisticado, vivió un buen tiempo como teorema en busca 
de un contexto amplio; se refiere a los puntos que uno puede construir a partir de dos 
ternas colineales. 


Teorema 6.13 (Papus) Sean a¡,b,,c,, 47, b2,C2 seis puntos 
b, C; distintos tales que a1,b,,C1 y a2,b>,c2 son colineales pero en 


AE rectas distintas, entonces su terna de Papus 


A = (b1, C2) 2 (b2,C1) 
B = (c,,a2) MN (cz, ar) 
y = (a,b) M (az, b1) 


es colineal. 
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Antes de demostrarlo, notemos que su enunciado es netamente proyectivo. Su 
conclusión es sobre puntos de intersección de rectas, y si nos pusiéramos euclidianos, 
sería muy engorroso enunciar los distintos casos especiales de paralelismo tanto en la 
hipótesis como en la conclusión. 

Demostración. Veamos el caso en que ninguno de los puntos es la intersección de 


las dos rectas. Consideremos la configuración dual; es decir, sean aj, bi, c; las rectas 


polares de a;, b;,c; respectivamente, para i= 1,2. Se tiene en- 
tonces que cada terna de rectas es concurrente. 
Mediante una transformación proyectiva, y quizá renombrando 
los puntos, podemos mandar a, 


danb; +» [1:0:0] 
anbi » l0:1:0] 
o ainaj > [0:0:1] 
o binbioP [1:1:1). 
a; Ak Le > Ñ 
hi Para entonces trabajar en el IR? de la carta canónica. 


a; b, E, Como cj y c5 no son la recta al infinito, quedan deter- 
minadas por su punto de intersección, (s,t) =cjNej3. 
Entonces las rectas polares a la terna de Papus tienen las ecuaciones 


Y x+y=1 
pr: tx+sy=ts 
oro: t—-1)x+(s—1)y =ts—1, 


que indican claramente que son rectas concurrentes, y por tanto sus puntos polares 
son colineales. 
El caso faltante, y posibles degeneraciones de las hipótesis, se dejan al lector. U 


EJERCICIO 6.55 Demuestra el Teorema de Papus cuando uno de los puntos es la 
intersección de las dos rectas. 


EJERCICIO 6.56 ¿Se puede relajar el teorema a que los seis puntos no sean necesari- 
amente distintos? ¿A qué casos? 


6.7 El plano proyectivo rígido 


Hasta ahora sólo hemos considerado el plano proyectivo “holgado”, con su estructura 
de incidencia (las rectas como subconjuntos distinguidos) y las transformaciones que 
la preservan (las proyectividades). Pero también tiene nociones métricas naturales 
(distancia y ángulos) y con ellas se convierte en el plano proyectivo “rígido” también 
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conocido como “plano elíptico” o podríamos decir que es el “plano esférico”; está 
más en la idea general de “geometría” que tenían los griegos y entonces sí es un 
contraejemplo de la necesidad del Quinto Postulado: cumple todos los axiomas de 
Euclides excepto el Quinto. 
Como habíamos anticipado en la Sección 6.5.3, las nociones de distancia y ángulo 
en IP? se heredan naturalmente de la esfera S?. Pues ahí vimos que S? cubre 2a 1 a P? 
(este último se obtiene identificando antipodas en S?) y localmente 
(es decir, en pequeños pedazos) son idénticos. 

Quizá el modelo del proyectivo rígido “más preciso” (aunque ésta 
sea una cuestión subjetiva) es pensarlo como media esfera (de cas- 
carón no de hule, y cualquier media esfera) con 
la salvedad de que puntos opuestos de su frontera 
son el mismo y que entonces las distancias hay que 
medirlas a veces por “fuera”. En una hoja de papel, 
conviene usar el modelo estereográfico del disco (pg. 

279) pues tiene la gracia de preservar ángulos (aunque no distancias); == 
y, por supuesto, puntos antípodas en la frontera se identifican. 

Más formalmente, sean [x] y [y] dos puntos en P?. Como rectas en I¡R* generan un 
plano (euclidiano) y en él estas dos rectas forman dos ángulos; definimos su distancia 
d ([x], [y]) como el mínimo de ellos. De tal manera que 


0 < ad (lx]l,[yl) < 7/2; 


la igualdad con 0 se da sólo cuando [x] = [y], y la cota máxima se alcanza cuando 
las rectas [x] y ly] son perpendiculares, es decir, cuando [y] € li. Si se quiere una 
fórmula más analítica, podemos definir 


d (bd, [y]) := arecos (2) (6.15) 


Las curvas en PP? cuyo recorrido logra las distancias (las de distancia mínima) o 
“geodésicas” son justo las rectas proyectivas (que corresponden a planos por O en R*, 
o bien a los círculos máximos en S?). Todas las rectas proyectivas tienen longitud 71 
(o “circunferencia” podría decirse, pues son topológicamente círculos) y, por eso, lo 
más alejados que pueden estar dos puntos en una de ellas es la mitad cuando ambos 
segmentos de uno a otro miden lo mismo. 

La recta polar de un punto [xl], fix, consta entonces de todos los puntos 

a distancia máxima de [x], los más alejados de él; y para cada uno de ellos, 

[y] € fix, digamos, se tienen justo dos geodésicas para llegar de [x] a él, que 

juntas forman una recta. E inversamente, para cada recta l hay un único 
punto, su polar, que está a distancia 711/2 de todos sus puntos, 
y se llega a él saliendo ortogonalmente hacia cualquiera de los 
dos lados y desde cualquier punto de fl ... pero nos estamos adelantando. 


6.7. EL PLANO PROYECTIVO RÍGIDO 297 


La noción de ángulo en IP? también se copia de S?. Notemos que si bien las rectas 
de IP? corresponden biunívocamente a los puntos de P?, tenemos una correspondencia 
natural entre las rectas orientadas de IP? y los puntos de la esfera S?. Pues 
la orientación de una recta en PP? (una partícula que viaja inercialmente 
en ella, puede pensarse) se levanta naturalmente a una orientación de su 
círculo máximo correspondiente (dos partículas antípodas persiguiéndose 
inercial e inútilmente); y, como vimos en la Sección 5.2.1, a esta recta 
esférica orientada le corresponde un punto polar en S?. Los ángulos entre 
rectas orientadas en P? se miden entonces como sus correspondientes en EA 
S? (por la distancia de sus puntos polares). A 

Cada uno de los teoremas o resultados métricos que demostramos para la esfera 
(en las Secciones ?? y 5.2.3) se cumplen en el plano esférico (o proyectivo rígido); la 
diferencia esencial es que aquí las rectas se intersectan en un único punto y se pierde 
la redundancia que siempre acarreaban las parejas antípodas en S?. No vale la pena 
reescribirlos. 


EJERCICIO 6.57  Argumenta por qué la definición (6.15) corresponde a la descripción 
previa de distancia en [P?. 


EJERCICIO 6.58 ¿Cuántos triángulos definen tres rectas en P?? 
EJERCICIO 6.59 ¿Cuál es la fórmula del área de los triángulos en P?? 


EJERCICIO 6.60 Da un ejemplo de tres puntos en P? tales que las tres rectas que 
pasan por ellos forman sólo triángulos iguales. ¿En qué ángulos se intersectan estas rectas? 


6.7.1 Las isometrías de P? (SO(3)) 


Podemos diferenciar al plano proyectivo holgado del rígido de manera “kleiniana”, por 
el grupo de transformaciones que implícitamente se están considerando. Mientras que 
en el primero está uno pensando en el grupo de todas las proyectividades (Pr(2)), en 
el segundo sólo se toma en cuenta al subgrupo de transformaciones proyectivas que 
preservan la métrica, es decir, a las isometrías. 

Puesto que la métrica de P? se derivó de la de S?, entonces las transformaciones 
lineales que fijan a S? y preservan su métrica (es decir, las ortogonales O (3)) son las 
que dan lugar a isometrías de P?. 

Notemos que la función antípoda a € O (3) da lugar a la identidad en PP? y es la 
única que lo hace además de la identidad (Ejercicio 6.62). Entonces la proyectivización 
de f y de aof son iguales para cualquier f € O (3), y sólo una de ellas está en SO(3) 
(preserva orientación de S? y R*) pues la función antípoda a invierte la orientación de 
S?. Por lo tanto, las isometrías de P? están en correspondencia biunívoca con SO(3): 
los movimientos orientados de S?. 
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Esto implica (por el Teorema 5.14) que todas las isometrías de 
P? son rotaciones. Efectivamente, al ir rotando en un punto, [u] dig- ' 
amos, su recta polar se va transladando la distancia correspondiente / 
al ángulo (como en la esfera). Pero al llegar a la rotación de TT en g 
[u] su recta polar lí ya regresó a su lugar punto a punto. En ese 
momento tenemos la reflexión en ly (su espejo); localmente, en una Y > 
vecindad de la recta, equivale a empujar una banda > 
de Moebius dentro de sí misma una vuelta: el corazón, 
regresa a su lugar pero los “dos” lados (tanto de la | y 
banda como del corazón y vistos localmente) se han 
intercambiado. Y a partir de 7t, seguir rotando en [u] 
parece un paso en f¡ hasta dar una segunda vuelta 
y llegar a la identidad (rotar 271). Así, los cuatro tipos de isometrías 
que teníamos en el plano euclidiano (y que, con algo más, reaparecerán 
en el plano hiperbólico) se vuelven lo mismo en el plano proyectivo rígido. En él sólo 
hay un tipo de isometrías, aunque se pueden ver desde distintos puntos de vista. 
Notemos del párrafo anterior que hay tantas reflexiones en P? como rectas; es decir, 
hay justo “un P? de reflexiones” en SO (3). Y que muy cerca de cada reflexión están 
los pasos chicos en ambas posibles direcciones de su recta; este P? de reflexiones se 
va “engordando” mientras consideramos pasos hasta un cierto tamaño creciente. 
al Nótese tambien que los pasos de una longitud fija forman una esfera S?, pues 
corresponden a las rectas orientadas y que todos los pasos de longitud TT son 
la identidad. Esta descripción remite a la de P? a partir —alejándose— de un P*. 
Pero por el momento sólo nos interesa establecer que SO (3) se puede pensar como 
un espacio —hay una noción natural de cercanía en él (también en los otros grupos 
de transformaciones que hemos considerado)— y que este espacio se siente cerca de 
entender mejor... 


EJERCICIO 6.61 Demuestra directamente que toda isometría de P2 es una rotación 
siguiendo las ideas de la demostración del Teorema 5.14. Verás que algunos argumentos se 
simplifican y que la demostración se limpia. 


EJERCICIO 6.62 Con base en el Teorema de 4 en 4, demuestra que si la proyec- 
tivización de una transformación en O (3) es la identidad, entonces es la identidad o la 
función antípoda. 


6.7.2 *El homeomorfismo de SO(3) con P* 


Consideremos de nuevo la acción natural de SO(3) en la esfera S? (sus movimientos 
rígidos). Recordemos de la Sección 5.3.1 que cada elemento de SO(3) es la rotación 
de un cierto ángulo x con eje en un vector unitario u € S?, donde a se mide de 
acuerdo con la orientación positiva definida en la superficie de la esfera. Además, a 
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tal rotación la habíamos denotado Pa y se tiene que Puu = Pau » esto es, que al 
rotar positivamente en un punto de la esfera, se está rotando negativamente en su 
antípoda —es por esto que al intentar abrir un frasco de mermelada no importa con 
qué mano se tome la tapa, el movimiento (o el pujido) va para el mismo lado—. 

Con esta notación, hemos coordinatizado con las “coordenadas polares” de R* a 
los elementos del grupo SO(3). Un punto x en R*, tiene como coordenadas polares 
a un número no negativo a (con a = [x)) y a un vector unitario u € S? (u = x/ [xl 
cuando x % 0 y puede ser cualquiera para x = 0), de tal manera que x = Au. 
Entonces, nuestra notación es una función natural 


p:R3 > SO(3), 


que en coordenadas polares se expresa como 
PU a 
y en coordenadas cartesianas tiene la fórmula 


Í idg2 sl x=0 
Xxh " 
Prx/pa. si XxX0. 


Nótese que esta función es “continua” en el origen, pues rotar cero grados en cualquier 
eje es la identidad y rotar con un ángulo muy pequeño está cercano a ella. 

Esta función es “periódica”. En la esfera de radio 271 es la constante identidad y a 
partir de ahí “vuelve a empezar”. Pero incluso ahí ya tenemos “redundancia”: ya le 
hemos “dado dos vueltas a SO(3)”, pues si llamamos B, a la bola sólida con centro 
en el origen y radio 7, es decir, 


B, =[(xER*| lx <m), 


entonces p(B,) = SO(3). Con la bola sólida B, ya cubrimos todas las rotaciones, 
pues una rotación de ángulo mayor que 7t se expresa en la antípoda con uno menor. 
Así que 

p: Bx => SO(3) 


es sobre y además es 1 a 1 excepto en la frontera, donde 


Pu => Px,-u; 


pues rotar 7 en una dirección es igual a rotar 71 en la contraria; nótese que correspon- 
den a las reflexiones de P? que vimos en la sección anterior. 

Así que SO(3) se puede pensar como la bola sólida B, identificando 
puntos antípodas en la frontera, pues estos dan lugar a la misma rotación 
(por un ángulo 71). Por la analogía de que 1P? se obtiene topológicamente 
de un disco identificando puntos antípodas en la frontera, este espacio 
debe ser el espacio proyectivo IP”. 
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En algunos ejercicios hemos dejado al lector el problema de generalizar a 3 y más 
dimensiones los principios y las definiciones básicas de la geometría proyectiva; por 
cuestión de completez, en los párrafos que siguen esbozamos las ideas fundamentales. 


m3 


Rudimentos de 


Se define P3 como el espacio cuyos puntos corresponden a la líneas que pasan por el 
origen en R*. Si denotamos con [x] a la línea por el origen determinada por x € R*, 
con x 4 0 ([x]:=(tx|t € Rj)), entonces 


P:=/[Hd|xeR* con x%0) 


y tiene nociones naturales de línea (correspondiendo a planos por el origen en R*) y 
plano (las líneas en subespacios de dimensión 3). Se tiene además que cualquier par 
de planos se intersectan en una línea y una línea y un plano (que no la contenga) se 
intersectan siempre en un punto. 

El espacio proyectivo se puede considerar con dos grupos naturales de transfor- 
maciones: el “holgado” que es con la proyectivización de todas las transformaciones 
lineales de R* (es decir, considerando su acción en las líneas por el origen), y el 
“rígido” donde sólo se considera la proyectivización de las transformaciones ortogo- 
nales O (4) que preservan el producto interior y, por tanto, los ángulos que dan la 
distancia natural de P*. En el espacio proyectivo rígido, todos los planos son copias 
de P? rígido y las líneas o geodésicas miden Tr. 

Por su parte, también tenemos la esfera unitaria de dimensión 3 que consta de 
todos los vectores unitarios en IR*, 


S i=[xEeR*|lx=1), 


y es tal que cada recta por el origen en R* la intersecta en dos puntos antípodas. 
Así que de nuevo hay un cubrimiento natural 2 a 1 de S* sobre P*. Un casquete o 
hemisferio de S* (el subconjunto donde alguna de sus coordenadas es no negativa) 
se puede identificar biyectivamente con una bola sólida en IR3, y entonces se puede 
ver que el espacio proyectivo IP? es (topológicamente) una bola sólida con puntos 
antípodas en la frontera identificados. Esto es lo que necesitábamos para concluir que 
SO (3) es topológicamente P* (se dice que son homeomorfos, “con la misma forma” ), 
pero vale la pena hacer la identificación con más precisión. 


Geometría de SO (3). 


Puesto que SO (3) tiene estructura de grupo, veremos que tiene una “geometría” 
natural y que, al hacer las identificaciones con cuidado, ésta corresponde a la de S?. 

Notemos primero que SO (3) tiene muchos subgrupos “circulares”: dado u € S?, 
todas las rotaciones con eje en u (que coinciden con las de su antípoda —u), 
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Su := ds 
forman un subgrupo que se comporta como el círculo S' con la suma 
de ángulos (isomorfo a SO (2)). Estos subgrupos son precisamente los 
diámetros al pensar a SO (3) como la bola B, con identificación de 
antípodas en la frontera. En estos círculos hay una distancia natural, la 
ángular; y a partir de ella podremos extrapolar a una métrica (noción de distancia 
en todo SO (3) haciéndolos geodésicos. 

Como cada elemento de SO (3) está en uno de estos círculos (único si no es la 
identidad), entonces su distancia a idg2 debe ser el ángulo de rotación, o proporcional 
a él. Para que la distancia corresponda a la natural de P*, hay que tomar la mitad 
de los ángulos y definir, para 0 < a < Tr, que 


d(Pxu, id) = 0/2. (6.16) 


De aquí, aprovechando la estructura de grupo que nos da las transformaciones 
“multiplicar por un elemento constante”, esparcimos la distancia definiendo para 
cualquier par f, g € SO (3): 


a(f,g) =d(fog”,id). (6.17) 


Pues al multiplicar un subgrupo circular (el que pasa por f o g”!) por un elemento 
que no esté en él (g) nos da nuevas geodésicas (una que pasa por f y g). 

Ahora sí, de las muchas maneras de identificar una bola sólida (B,) con un casquete 
de S* (por ejemplo la proyección estereográfica, proyecciones desde otros puntos o la 
ortogonal), la que geométricamente nos conviene es “untarla radialmente”: mandar 
a los círculos S,, isométricamente. Esto es, despues de reescalar a B, a la mitad, 
mandar a los diámetros por longitud de arco, que en coordenadas polares se escribe 


u:Br. > si 
u(a,u) = (cos(a/2),sen (x/2) u). 


Donde estamos pensando a R* como una pareja ordenada de 

un número real y un vector de R* (la identificación natural | EN 
R* =R x R?); o bien añadirle una “coordenada cero” a un ] 

vector de R*, y estamos dibujando a esta “coordenada cero” verticalmente. 


Veremos ahora que esta identificación u induce una isometría de SO(3) con 
Para esto, supongamos que f y g en SO(3) son 


f=Pwxa Y 9=Pap conabeS y0<a p<m/2. 


Por (6.17) y (6.16), debemos medir el ángulo de fo g”!. Puesto que 
g 7! es la rotación de 2f3 en el antípoda —b, por el Lema 5.15 tenemos 
que fog”! = P_2y e = P2y e » donde y y e son el tercer ángulo y vértice del triángulo 
con vértices A y —b y ángulos correspondientes x y fP. Sea C = ds: (a, —b) lo que 


mide el lado opuesto a y; por la Ley Esférica de Cosenos (Lema ??) se tiene que 
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cos y = cos € sen ar sen f3 — cos ax cos (3. 
Por el otro lado, la distancia en S*, que es la angular, se mide con el producto 


punto y se tiene 


u(2x,a)-u(28,b) = (cos ax, sen x a) - (cos f, sen 3 b) 
cos x cos [3 + sen x sen f (a - b) 


cos x cos [3 — sen x sen fB (a - (—b)) 
= cos aí cos [3 — sen x sen fB cos C = cos (T— y). 


Tenemos entonces que y (la mitad del ángulo de rotación de fog”! medido en el trián- 


gulo) y el ángulo entre los vectores 1 (2a, a) y u(2f8,b) en S* son complementarios. 
Pero en ambos casos, el menor de ellos es el que mide la distancia deseada: si y > 711/2 
entonces d (f, g) = T— y (hay que considerarlo como rotación en la antípoda), y la 
distancia en P* es el ángulo entre las rectas [1 (2a, a)] y [u(28,b)] que es < 1/2. 
Así que SO(3) y P* son métricamente equivalentes o, dicho de otra manera, P* tiene 
estructura de grupo compatible con su métrica natural. 

Resulta que también S* tiene estructura de grupo que se “levanta” de la de SO(3); 
así como SO(2) se puede pensar como los complejos unitarios, S? resulta ser los 
cuaterniones unitarios.* 


6.7.3 *Los politopos regulares de R* 


Una observación interesante, debida a Coxeter en [5], que no podemos dejar pasar 
pues ya se hizo casi todo el trabajo, es que los subgrupos finitos de SO(3) dan 
lugar a subconjuntos finitos muy homogéneos en S* al tomar su doble cubierta, y 
que de ellos se pueden construir los análogos de los sólidos platónicos en 
dimensión 4. Antes de verlo, considérese el ejemplo en dimensión 2 de n 
puntos equidistribuidos en S' (un subgrupo finito de SO(2)); al tomar 
la intersección de sus hemiplanos tangentes o bien su casco convexo (i.e., 
lo que “atrapan” entre ellos o el conjunto de sus combinaciones afines 
positivas), se obtienen polígonos regulares de n lados: respectivamente 
circunscrito o inscrito en S!. Es fácil ver que los sólidos platónicos 
se pueden definir análogamente con subconjuntos finitos de R*; tienen 
esferas inscrita y circunscrita. 

Ahora sí. Del grupo de simetrías orientadas del dodecaedro (que habíamos llamado 
235 en la Sección 5.4.1) con 60 elementos se obtiene, al tomar su preimagen bajo la 
proyección S? — P* = SO(3), un conjunto de 120 puntos en Sí € R* con mucha 
simetría. Tan es así, que al tomar sus hiperplanos (de dimensión 3) tangentes a 
la esfera e intersectar sus hemiespacios, se obtiene uno de los “politopos regulares” 


“Para seguir este camino ver [3]. 
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que generalizan a los sólidos platónicos. Está formado por 120 dodecaedros (que 
habíamos denotado con ((5, 3) en la Sección 5.4.3) pegados por sus caras y con 3 de 
ellos alrededor de cada arista; su símbolo de Schlafli es entonces ((5, 3,3]. Su dual se 
obtiene tomando el casco convexo de los 120 puntos: consta de 600 tetraedros con 
cinco alrededor de cada arista; es el (3,3,5). En la literatura en inglés se les conoce 
como el “120-cell” y el “600-cell” respectivamente; Coxeter también les llama panales 
(“honeycombs” ); en [2] se le llamó “dodecaédromo” al (5, 3, 3). 

Con el grupo de simetrías orientadas del tetraedro, el 233, y de cualquiera de las 
dos maneras (por tangentes o casco convexo), se obtiene el ([3, 4, 3) hecho de octaedros 
( (13,4) ) y de a 3 por arista; resulta ser “autodual”. El hipercubo ((4, 3, 3)) se obtiene 
por tangentes a partir del grupo 222 con las rotaciones de 7t en los tres ejes; y su dual 
(13,3, 4) es el casco convexo. 

Falta un politopo regular, el (3, 3, 3) análogo del triángulo y el tetraedro con 5 vér- 
tices equidistantes. Y sobra un grupo importante: el del cubo. No todos, poliedros y 
grupos finitos, caen en este esquema... pero aquí lo dejamos, pues habíamos prometido 
no meternos demasiado en la dimensión 4. 


6.8 *Despliegue de realidad virtual 


La “realidad virtual” —esos juegos donde nos paseamos por un mundo imaginario, 
que está ahí, transcurriendo ante nuestros ojos en la pantalla de una computadora— 
consta, al menos, de tres grandes elementos. Primero, el escenario arquitectónico, 
la base de datos que lo define como una serie de objetos en tres dimensiones con 
sus posiciones, cualidades, texturas, etc. Segundo, que puede ser vacío, las reglas 
internas y los procesos que lo hacen cambiante y que permiten interactuar tanto a sus 
seres virtuales como al jugador. Y tercero, el procedimiento por el cual las porciones 
relevantes de estos datos se despliegan coherentemente en la pantalla para hacernos 
sentir que nos estamos moviendo, actuando y viendo lo que ocurre ahí. El problema 
que nos ocupa es este último, el de “ver” en una realidad virtual: desplegarla en 
la pantalla de una computadora; y, como veremos, es básicamente el problema del 
pintor con el que empezamos el capítulo pero hecho númerico y continuo. Además, 
su planteamiento teórico se aplica a otras muchas situaciones, como lo es parte del 
mecanismo básico de la visión humana. 


La cámara 


Suponiendo que tenemos un “mundo virtual” definido en R*, ¿qué ve un punto 
que se pasea por él? Primero hay que definir que es eso de “ver”: pensemos que 
deambulamos en ese mundo metidos dentro de una de esas cortinas negras de las 
cámaras daguerrotípicas de hace dos siglos, pero con una ventanita al frente (la 
pantalla de la computadora). Ver es asomarse el mundo desde esa ventana, o, lo 
que es lo mismo, proyectar al mundo externo en ella (la pantalla) que es parte 


...Dibujo 


...Dibujo 


...Dibujo 


304 CAPÍTULO 6. GEOMETRÍA PROYECTIVA 


de un plano; y esta proyección se hace desde un punto (el ojo hipotético del su- 
jeto ante la pantalla, o debajo de la cortina): es, entonces, el problema del pintor 
con que arrancamos el capítulo. Pero tenemos aún más; ese plano está coordina- 
tizado. La pantalla de una computadora consta de pixeles determinados por dos 
coordenadas y a ellos habrá que asignárseles un color. Nótese, además, que tam- 
bién un lienzo en blanco, la película (o el detector digital) en una cámara o bien 
la retina de un ojo (suponiéndola plana para incluirnos en la discusión) tienen sus 
coordenadas locales establecidas. Entonces hay que pensar que en ese plano hay 
un origen y dos vectores direccionales distinguidos, Uy y uz dig- 
amos, que lo generan y coordinatizan. 

Además, está el punto desde el cual se proyecta, llamémoslo el 
foco, que tiene una posición bien definida Uy € IR3; y para acabar 
de definir el plano y la proyección, tomemos a uz como el vector 
que va del foco al origen del plano pantalla. Estos cuatro vectores 
definen una “cámara” . 

En la vida real (cámaras, telescopios, ojos, etc.) u, y uz son de tamaño fijo. En 
un ojo, uz también lo es y apunta hacia atrás del foco (la retina está detrás del foco 
que es simulado por un sistema óptico). En una cámara de cine —donde incluimos 
la fotográfica— uz también apunta hacia atrás pero es variable: su tamaño es la 
distancia focal. Al crecer se tiene el efecto de zoom, se hace telefoto; y al decrecer 
tiende al gran angular pues más de la escena entra a la parte sensible de la pantalla 
(al acercarse a una ventana aumenta la porción de mundo que se ve en ella). 

Por su parte, tanto en la computadora como en el caso del pintor, uz apunta hacia 
adelante, hacia la escena relevante. En la computadora, uy y u2 son las coordenadas 
de la pantalla y uz representa la distancia del usuario promedio a ella; aunque al 
hacerla crecer se logra el efecto de acercamiento o magnificación (sin que el usuario se 
tenga que mover de su lugar). Este efecto también se puede lograr en la computadora 
disminuyendo los vectores uy y uz que definen las coordenadas de la pantalla (y 
seguir pensando que el usuario sigue en su silla). Nótese, por último, que cambiar 
uy, corresponde justamente a desplazar la cámara, paralela a sí misma, dentro del 
mundo; da la posibilidad de “pasearse” por él. Y aquí sí, ni modo, se trivializa para 
el pintor y su caballete fijo. 

En la cámara canónica, cuando u;, uz, uz es la base canónica y us es el origen, 
conviene pensar a las dos primeras coordenadas, la x y la y, como las de un plano 
vertical y a la coordenada z como la profundidad (las z positivas son las que interesan 
cuando pensamos en el lienzo o en la pantalla de la computadora, y las negativas para 
la película o la retina). Entonces la función proyección es muy sencilla de expresar: 


« 


SR" 
piba. = (3/2U/2). 


Pues la intersección de la recta por el origen (el foco) y el punto “real” (x,y,z) con 
la pantalla (que es el plano z = 1) es (x/z,y/z, 1), pero de éste sus primeras dos 
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coordenadas son las de la pantalla. El problema general se resuelve a partir de éste. 

Dada una cámara cualquiera u;¡, u, uz, uy y un punto Xx € R3, su imagen se 
obtiene aplicando q a las coordenadas con que se expresa x en las coordenadas afines 
del sistema de referencia dado por la cámara. Y el problema númerico se reduce a 
encontrar tales coordenadas; hay que expresar el mundo en ese sistema y dividir a las 
dos primeras coordenadas entre la tercera. 


6.8.1 Proyecciones del espacio proyectivo 


Aunque en principio hemos resuelto el problema, veamos que al proyectivizar éste 
adquiere más consistencia y la solución numérica se hace más fácil en la práctica. 

Primero tenemos que pensar en R% como la carta canónica de P*, que analíti- 
camente es añadir un 1 a las tres coordenadas y pensar a estas como homogéneas. 
Geométricamente, se añade entonces un plano proyectivo al infinito con coordenadas 
homogéneas [x : y : z: 0], que, si llamamos w a la nueva coordenada homogénea, está 
determinado por la ecuación w = 0. Un punto [x:y:z:w] € P* que no tenga su 
última coordenada cero representa al punto (x/w, y/w, z/w) € R3. 

En términos de definir una realidad virtual, pensar en R3 como parte del espacio 
proyectivo añadiéndole un plano proyectivo al infinito es importante, pues permite 
agregar un horizonte; un fondo en el infinito, una textura fija definida por las posibles 
direcciones. Parecería que hay una contradicción con que en el espacio proyectivo PP? 
se llega al mismo punto al infinito viajando en direcciones opuestas. Pero no hay tal 
contradicción. En efecto es el mismo punto, pero cada plano tiene localmente dos 
lados y a estos puede asignárseles colores diferentes. 

La información de una cámara equivale a la matriz de 4 x 4 


Éé= uy u uz u, 
E A CS O E 
donde los datos reales son la matriz superior de 3 x 4 y a la cual se añade un renglón 
con 0's y un l al final. Análogamente a la Sección 6.6.4, esta matriz representa en 


PS a la transformación afín de R% que manda a la cámara canónica en la dada, pues 
obsérvese que manda al vector (x,y,z, 1) en 


xu + yu) + zuz + uz. 


Lo que se necesita entonces, para dar númericamente a la proyección determinada por 
la cámara C, es encontrar su matriz inversa y luego aplicar la proyección canónica; 
es decir, se tendrá la fórmula 


vol (eo 
Parecería muy difícil sacar la matriz inversa de una de 4 x 4, pero en la práctica 


se puede hacer en forma muy sencilla. Nótese primero que la identidad 1 corresponde 
a la cámara canónica que es donde, para simplificar, se puede empezar un recorrido 
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por el mundo virtual. Y segundo, que los movimientos que producen las teclas cor- 
reponden a matrices muy sencillas. Por ejemplo, las flechas izquierda y derecha, o 
los correspondientes movimientos del ratón, son rotaciones en el plano u;, uz (voltear 
hacia arriba o hacia abajo son rotaciones en el plano uz, uz) cuyas matrices son muy 
simples y sus inversas se obtienen casi trivialmente. Así que si tenemos una cámara 
dada C, un teclazo de estos cambiará a C7! multiplicándola (por el lado adecuado: 
¿cuál es éste?) por la correspondiente matriz de rotación. De la misma manera, mo- 
verse hacía adelante es cambiar Uy por uy + tuz, cuya matriz correspondiente y su 
inversa son muy sencillas. Entonces, al ir apretando las teclas, los coeficientes de la 
matriz importante para la proyección, que es C7!, van cambiando poco a poco y de 
manera fácil de obtener. 


Capítulo 7 


Cónicas III (proyectivas) 


En este capítulo retomamos la motivación que surgió de las cónicas en R? para es- 
tudiar el “infinito” y que nos llevó a definir la geometría proyectiva. Ya tenemos la 
herramienta para entender y formalizar el comportamiento de las cónicas en el in- 
finito, pero con el mismo esfuerzo se puede hacer una buena parte de la teoría para 
curvas algebraicas en general, y así lo haremos. Después clasificaremos las cónicas 
proyectivamente y esbozaremos qué debe pasar en dimensiones más altas. 


7.1 Curvas algebraicas en P? 


Lo que nos interesa principalmente es la completación proyectiva de las curvas cuadráti- 
cas, es decir, entender el comportamiento de las cónicas al infinito, pero hay ciertas 
partes de la teoría que se pueden generalizar fácilmente, y vale la pena hacerlo para 
no repetir verbatim lo que vimos en el Capítulo 4. Ahí definimos una curva cuadrática 
como los ceros de un polinomio cuadrático en dos variables x y y. Es claro que esto 
puede generalizarse a cualquier polinomio y eso haremos. 


7.1.1 Polinomios y su homogeneización 


Un polinomio en una variable x es una expresión 


Su grado es la máxima i para la cual a; 4 0, y cada sumando es un monomio. Un 
monomio en dos variables x y y es una expresión de la forma 


e 
ade, 
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donde a; es un número real; su grado es 1+ 3; y un polinomio en dos variables x y y 
es una suma finita de monomios. Así que se puede expresar como una sumatoria 


k 
P(x,y)= Y ax), (7.1) 


1,=0 


donde quizá muchos de los coeficientes as; son 0. El grado de un polinomio en dos 
variables es el máximo grado de sus monomios (que no necesariamente coincide con 
el límite superior k de la sumatoria anterior, que se puso ahí sólo para enfatizar que 
hay un número finito de sumandos). 

Los polinomios en dos variables (como los de una) tienen una estructura algebraica 
muy rica. Se pueden sumar (y con la suma forman un grupo) y se pueden multiplicar 
(aunque no forman un grupo multiplicativo pues no tienen inversos). En este sentido, 
son como los números enteros, Z, su unidad multiplicativa es el polinomio constante 
1, y por esto se le conoce como el anillo de los polinomios. 

Vale la pena declarar de una vez por todas que cuando digamos “polinomio” sin 
especificar el apellido “constante” nos referimos a un polinomio de “a de veras”, de 
grado al menos 1. Los de grado 0 (las constantes distintas de cero) y el de grado —1 
(la constante 0 a la que hay que ponerle este grado para que las cosas funcionen) no 
se entrometerán tanto en el texto con esta convención. 

Como en el caso de los polinomios en una variable, los polinomios en dos variables 
se pueden considerar también como funciones con valores reales (al evaluar susti- 
tuyendo valores fijos de las variables), pero en este caso su dominio es R?. Una curva 
algebraica en R? es el conjunto de ceros de un polinomio P, es decir 


C(P):=1(9)€R*[P(1)=0). 


El grado de una curva algebraica es el grado de su polinomio asociado. Ya hemos 
clasificado las curvas algebraicas de grados 1 y 2 (rectas y cónicas). El problema 
natural de entender y clasificar todas las curvas algebraicas ha dado lugar a lo que 
ahora se conoce como geometría algebraica que claramente requiere un estudio 
más profundo del álgebra subyacente. Por el momento, veamos una relación muy 
sencilla entre el álgebra y la geometría. 

Supongamos que un polinomio P es el producto de dos polinomios Py y Pz. Es de- 
cir, que P se obtiene al multiplicar, con las reglas de los número reales, las expresiones 
de P¡ y de Pz (todos los monomios de uno contra los del otro y luego agrupando). 
Esto se escribe 


P (x, y) + P (X,y) P) (x, y) > 
Entonces es cierto que para cualquier valor de las variables x,y esta igualdad se 


cumple. En particular se obtiene que 


P (x, y) =0 > P (x, y) =0 o P) (x, y) =0, 
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y por lo tanto que 


C(P) = C(P¡JU C(P,). 


Hemos demostrado que si P es reducible (es decir, si P es un pro- 
ducto de polinomios, de grado > 1, recuérdese nuestra convención), 
entonces su curva algebraica asociada es unión de curvas algebraicas. 
Esto explica en general por qué cuando clasificamos curvas cuadráti- 
cas nos aparecían a veces parejas de rectas; surgen de la multiplicación de dos poli- 
nomios lineales. Es natural definir entonces que una curva algebraica es irreducible 
si su polinomio asociado lo es, es decir, si no se puede expresar como un producto de 
polinomios (de grado al menos 1, insistimos por última vez). 

Es muy claro que también tenemos polinomios en tres (o n ) variables; que tienen 
su grado, su suma y multiplicación y que sus ceros definen subconjuntos de R* (o, 
respectivamente, de R”) a los que se les llama superficies algebraicas (o bien, hiper- 
superficies algebraicas). Por el momento, nos interesa definir un polinomio de tres 
variables a partir de uno de dos. 


Dado P como en (7.1), su homogeneización, o bien su polinomio homogéneo aso- 
ciado, es 


P (uz) e a Ayiz ni, 
1, =0 


donde n es el grado de P. 

El nombre viene de que, en general, se dice que un polinomio es homogéneo de 
grado n si todos sus monomios son de grado n. Y la receta para obtener el polinomio 
homogéneo asociado es muy fácil: cada monomio se multiplica por la potencia de z 
necesaria para convertirlo en monomio de grado n. De su polinomio homogéneo se 
puede recuperar el polinomio original al hacer z = 1; es decir, se tiene que 


Pivl= Pica, TU: (7.2) 


De tal manera que la asociación P +> P es inyectiva de los polinomios de grado n 
en dos variables a los homogéneos de grado n en tres variables. Y un polinomio 
homogéneo en tres variables viene de uno en dos si y sólo si z no aparece en todos 
sus monomios, es decir, si y sólo si el polinomio z no lo divide. Esto se da pues a los 
monomios de grado n de P (que los hay) no se les multiplica por nada (z% = 1). 


2 2 2 2 


1, x*=y*-1 


EJERCICIO 7.1  Argumenta geométricamente que los polinomios x 
y x? — y son irreducibles. 


HY 


EJERCICIO 7.2 ¿Cuáles son los polinomios homogéneos asociados a los anteriores? 
¿Puedes describir las superficies que definen en RR3? Describe cuáles son sus intersecciones 
con los planos horizontales z = cte; y luego qué pasa cuando z varía. 
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EJERCICIO 7.3 Demuestra que la superficie algebraica definida por el polinomio ho- 
mogéneo asociado a un polinomio lineal en dos variables es un plano por el origen. 


7.1.2 Conos y curvas algebraicas proyectivas 


Veamos ahora cómo es la superficie algebraica definida en R* por la homogeneización 
de un polinomio en dos variables. 

Hay que explicitar primero lo que dijimos antes por ensimita. Dado cualquier 
polinomio en tres variables P(x, y, z), define un subconjunto de R*, 


C(P]= ua) c R|P(x,y,z) = o?, 


llamado su superficie asociada. Y a estos subconjuntos se les conoce como las super- 
ficies algebraicas de R?. Un ejemplo que ya conocemos bien son los planos, ya que 
están definidos por polinomios lineales. Otro ejemplo que ya hemos estudiado es la 
esfera unitaria S? = (08, zER* Ix+y421= 0»; o bien, cualquier esfera, 


pues estará definida por un polinomio de la forma (x — a)? + (y — b)* + (z— c)? - a? 
(ver más ejemplos en los siguientes ejercicios). 

Supongamos ahora que P(x, y, z) es un polinomio homogéneo en tres varia- 
bles. Se cumple entonces que O € C(P), pues como cada monomio tiene al menos una 
variable, se anulará en el origen; esto es, P(0,0,0) = 0. Pero además, la propiedad de 
ser homogéneo nos da que para cualquier t € [R se cumple que 


P(tx,ty,tz) =' P(x,y,z), (7.3) 


donde n es el grado de P; pues en cada monomio se asocian las t correspondientes 
a las tres variables para darnos una t” que se factoriza en toda la sumatoria. Esta 
propiedad es exclusiva de los polinomios homogéneos, pues en los otros las t de los 
monomios adquieren diferentes exponentes y es imposible factorizarlos más allá de 
los pedazos homogéneos de un grado dado. 

Esta propiedad tiene una implicación geométrica importantísima: 


C(P)es unión de rectas por el origen. 


Pues (7.3) implica claramente que 


Piu z)=0 € Plítxtutz=0, VtelR. 


Conviene introducir la notación de un vector variable x = (x,y,z) con la 
obvia P (x) = P(x,y,z), para poder concluir que si x 4 0 (nada más para 
estar de acuerdo con nuestra convención del capítulo anterior), entonces 


xeC(P) > [xcCcIP), 


donde [x] está pensado como recta por el origen en R*. Pero si lo pensamos como 
punto en 1P?, nos lleva a la definición básica de este capítulo. 
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Definición 7.1.1 Una curva algebraica de grado n (> 1) en el plano proyectivo es 
un subconjunto definido como 


EP) = [bd EP ]P(x)=0), 


donde P(x,y,z) =P (x) es un polinomio homogéneo de grado n. Si además P es la 
homogeneización de un polinomio P(x,y), entonces a C(P) se le llama la cerradura 
proyectiva de la curva algebraica C(P) C R?. 


Puesto que C(P) CRY es unión de rectas por el origen, se le llama cono. Y esta 
misma razón nos permite pensarlo como un conjunto bien definido de puntos en p?, 
que denotamos C(P). En el caso que P se obtiene de un polinomio en dos variables 
P (x,y) como su homogeneización, entonces (como demostraremos a continuación) 
este cono consiste exactamente de las rectas que pasan por el origen y los puntos de 
la curva C(P) dibujada en el plano coordenado canónico z = 1 (es el cono sobre C(P)); 
y apenas incluye unas cuantas rectas horizontales más que corresponden a cómo se 
aproxima la curva al infinito. 


Teorema 7.1 Sea P(x,y) un polinomio de grado n. Entonces su curva algebraica y 
su cerradura proyectiva coinciden en R? (pensado dentro de P? como la carta coorde- 
nada canónica z = 1), es decir, 


C(P) = C(P) NR? 


y además, la cerradura proyectiva tiene a lo sumo n puntos en el infinito, es decir 


A(C(P) — C(P)) <n. 


Demostración. Sea IT; el plano z = 1 en R?, e identificamos sus puntos con los de 
R? como siempre (mediante la correspondencia (x, y, 1) + (x,y)). 
Demostremos primero que 


C(P) =C(P) NM. (7.4) Y 


Puesto que P (x,y) =P (x,y, 1) (recúerdese (7.2)), se tiene que 


Plwy)=0 ES P(xy,1=0. 


La expresión de la izquierda dice que (x,y) € C(P) y la de la derecha que su punto 
correspondiente en TT,, (x, y, 1), está en C(P). Lo cual demuestra (7.4). 
Consideremos ahora el primer enunciado del teorema. Si [x] € C(P)NR?, entonces 
está representado por un vector x = (x,y,z) € R* tal que z 4 0 y que además está 
en el cono C(P). Pero entonces (x/z,y/z, 1) también está en C(P), y por (7.4), está 
en la curva original C(P); por tanto C(P) NR? C C(P). El otro lado es más fácil, si 


(x, y) € C(P), entonces P (x,y,1) =P (x,y) =0 y por definición [x : y : 1] € C(P). 


Dibujo... 
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Entonces, lo único muevo que puede tener C(P) (que no tenía C(P)) está en el 
infinito, es decir, puntos de la forma [x:y: 0]. Para estudiarlos, consideremos el 
plano To paralelo a Ty por el origen, dado por la ecuación z = 0. Nos interesa ahora 
describir el conjunto 

C(P) NT. 


Sabemos que consiste de rectas por el origen. ¿Cuáles? Para saberlo, 
hay que sustituir z = 0 en el polinomio P: esto anula todos los 


monomios de P excepto los de grado n, que son los únicos que no 
multiplicamos por z (o una potencia mayor de z) para obtener P. A 
Esta es la parte dominante o de grado máximo del polinomio P, llamémosle P, 
decir, 


Pi ul= Pb y.0. 


Podemos identificar a C(P) N Mo con C(P,), y ello por la correspondencia obvia 
(x,y,0) O (x, y). Como P,, es homogéneo de grado n (aunque ahora de dos variables) 
se corrobora que C(P,,) consiste de rectas por el origen en un plano. Nos falta ver 
que son a lo más n para completar el teorema. 

Supongamos primero que el polinomio y no divide a P,,, es decir, que no todos los 
monomios de P,, tienen a y (o, lo que es lo mismo, que el coeficiente de x” es distinto 
de cero). Esto implica que la recta y = 0 no está en C(P,) pues P, (1,0) 4 0 (es justo 
el coeficiente de x”). Se tiene entonces que todas las rectas de C(P,) intersectan a la 
recta y = 1 en un punto que además las determina. Estos puntos se encuentran al 
resolver la ecuación en x 

P.(x,1)=0. 


Como P,(x, 1) es un polinomio de grado n en una variable, tiene a lo más n raíces 
reales, y hemos terminado. 

Nos falta el caso en que y divide a P,,, pero es igual de fácil. Ya tenemos una 
recta de C(P,), pues P,(x,0) = 0. Al factorizar y nos queda un polinomio de grado 
menor que n y sus soluciones, como en el caso anterior, serán a lo más n — 1. Ol 


Observación. Aunque hemos usado los polinomios homogéneos para definir las 
curvas algebraicas proyectivas, estos no definen funciones de P?; hay que resistir 
la tentación pues, a diferencia del caso euclidiano, no tienen valores bien definidos 
excepto sus ceros. Nótese que el valor de un polinomio homogéneo en tres variables 
cambia dentro de una línea por el origen en R* esencialmente como lo hace t”; ahí 
no es constante y por tanto no se le puede asignar un valor al punto proyectivo 
correspondiente excepto cuando es cero. 


Ejemplos 


Líneas rectas Sabemos que cualquier línea recta de R? está definida por un poli- 
nomio lineal ax + by + Cc. Su homogeneización ax + by + cz define precisamente su 
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completación proyectiva que intersecta a la línea al infinito en el punto [—b: a: 0). 
De tal manera que lo que hemos hecho incluye lo que ya sabíamos del Capítulo 6 
sobre los polinomios lineales y las rectas. 


Cónicas Sea 
P (xy) =x*+y?-1. 


Sabemos bien que C(P) es el círculo unitario S'. Su polinomio homogéneo asociado 
es 
P (x, y, 2) == e +y? a En; 


que define el cono desde el origen del círculo unitario dibujado en el plano z = 1. 
Esto se puede ver desde la óptica de la demostración anterior, o bien observando 
que al variar z se obtienen círculos centrados en el origen con radio |zl. La parte 
dominante de P es P2(x,y) = x? + y?, cuya única solución es (0,0), la que no vale 
proyectivamente. De tal manera que su completación proyectiva es ella misma, S' no 
tiene nada al infinito; lo cual es bastante obvio, pero corrobora que nuestro método 
es bueno: no añade nada si no hay necesidad. 
Consideremos ahora a la hipérbola; sea 


Pr y =tey-i, 


cuyo polinomio homogéneo asociado es 


P (x,y,z) =x? YU 


En el infinito, cuando z = 0, tenemos la parte dominante 


Pa (x,y) =x? —y? = (x+y)(x— y), 


que define dos rectas, las asíntotas. De tal manera que a la completación proyectiva 
de la hipérbola, C(P), se le añaden en el infinito precisamente los puntos correspondi- 
entes a sus asíntotas. El cono C(P) es de nuevo un cono circular pero ahora horizontal 
que intersecta al plano z = 0 en las asíntotas. Para ver esto, obsérvese que su inter- 
sección con el plano x = 1 es un círculo unitario; o en general, que sus intersecciones 
con los planos x = cte son círculos que crecen linealmente (la coordenada x desem- 
peña ahora el papel que tenía la coordenada z en el caso anterior). Pensando en 
el plano proyectivo, la hipérbola se ve como círculo en la carta coordenada x = 1. 
Proyectivamente es igual al círculo. 
Veamos por último a la parábola definida por el polinomio 


Poy ==2u, (7.5) 
cuyo polinomio homogéneo asociado es 


P uy, z) = x? — 2z4. (7.6) 


...Dibujo 


...Dibujo 
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Su parte dominante es P, (x, y) = x?, cuya única solución es la recta x = 0 (el eje y). Dibujo... 
Así que, como era de esperarse, la parábola intersecta al infinito en un solo punto: el 
correspondiente a su eje. En este caso, el cono C(P) vuelve a ser un cono circular, 
pero ahora “descansa” sobre el plano z = 0; es decir, lo toca únicamente en una línea. 
También contiene al eje z, y los planos donde se intersecta en un círculo tienen la 
ecuación y + z = k, con k constante (ver Ejercicio 7.4). 

Obsérvese que en este caso el cono € (P) es tangente al plano z = 0, lo cual quiere 
decir que la línea al infinito es tangente a la cónica proyectiva C(P). Esto es, las 
parábolas son tangentes a la línea al infinito y la tocan en un punto único. 


El Teorema de Bézout (descripción) 


Ya con algunos ejemplos concretos en la cabeza, esbocemos algunas consecuencias del 
Teorema 7.1. 

Primero, como ya habíamos visto, los únicos polinomios homogéneos que no son la 
homogeneización de un polinomio en dos variables son aquellos divisibles por z; y que 
entonces tienen a la recta al infinito z = Ó como componente. Pero la recta al infinito 
no tiene nada de especial dentro del plano proyectivo. Así que una curva algebráica 
proyectiva o bien contiene una recta dada (como componente), o bien la intersecta en 
un número finito de puntos y este número es a lo más el grado de la curva. Hemos 
visto ya tres ejemplos donde este número varía entre 0 y el grado de la curva. Si hay 
menos puntos de intersección que el grado es porque algún polinomio no tuvo todas 
sus raíces potenciales; algunas de ellas fueron complejas, y esto es porque los números 
reales no son “algebraicamente cerrados”. 

Los números complejos sí son algebraicamente cerrados, es decir, cualquier poli- 
nomio (en una variable) tiene tantas raíces como su grado.' En el siglo XIX se 
desarrolló su teoría a la par que explotaba la geometría. Las dos ideas se lograron 
juntar dando lugar a lo que ahora se conoce como geometría algebraica. En ella se 
siguen (y de ella surgen) las ideas de construir una geometría proyectiva con coorde- 
nadas homogéneas y básicamente las mismas definiciones que hemos dado, pero sobre 
el campo de los números complejos. Y en ese contexto, sí es cierto lo que se intuye, 
si dos curvas algebraicas no tienen componentes comunes, entonces se intersectan en 
tantos puntos (contados adecuadamente con multiplicidad) como el producto de sus 
grados. Á esto se le conoce como el Teorema de Bézout, pero rebasa el nivel de este 
libro; que quede ahí como motivación. 


EJERCICIO 7.4 Demuestra que la intersección del cono € (P) de la parábola, donde 
P(x,y) = x? — 2y, con el el plano y + z = k (con k constante) es un círculo, y da una 
parametrización isométrica de él. ¿Cuál es el radio de ese círculo? 


Ver Apéndice. 
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EJERCICIO 7.5 Considera la familia de polinomios Px(x,y) = x? — y? — k, donde 
k es una constante real. Demuestra que las curvas algebraicas de todos estos polinomios 
intersectan a la recta al infinito en los mismos dos puntos: ¿cuáles son? ¿Puedes dibujar 
qué tipos de curvas definen en R? cuando k es negativa y cuando k es positiva? ¿Cuando 
es chica o grande? 


EJERCICIO 7.6 Considera la familia de polinomios Px(x,y) = x? — xy? — k, donde 
k es una constante real. Demuestra que las curvas algebraicas de todos estos polinomios 
intersectan a la recta al infinito en los mismos tres puntos: ¿cuáles son? ¿Puedes dibujar, 
a grandes rasgos, qué tipos de curvas definen en R? cuando k es negativa y cuando k es 
positiva? Para esto, puedes encontrar los sectores de R? donde el polinomio Py(x,y) es 
positivo o negativo. 


7.1.3 Equivalencia proyectiva 


Así como definimos la equivalencia de curvas cuadráticas en IR? usando el grupo afín, 
para las curvas algebraicas proyectivas tenemos que usar el grupo de transformaciones 
proyectivas. La equivalencia geométrica puede muy bien definirse en general para 
subconjuntos. 

Dados dos subconjuntos C y C' del plano proyectivo, se dice que son equivalentes, 
y lo escribimos € = C', si existe f € Pr(2) tal que f(C') = C, 2.e, si son Pr(2)- 
equivalentes como figuras. Así, por ejemplo, todos los cuadrángulos (cuatro puntos 
en posición general) son equivalentes, o por dualidad, cuatro rectas sin tercias con- 
currentes lo son. Es fácil ver que ésta es una relación de equivalencia (ver Ejercicio 
TL): 

Uno de los problemas que dan lugar al desarrollo de la geometría algebraica es la 
clasificación de curvas algebraicas, entendida como la descripción o enumeración de 
sus clases de equivalencia. Como la herramienta para definirlas o trabajarlas son los 
polinomios, es necesario definir la equivalencia de polinomios homogéneos. 

Sean P (x,y,z) y Q [(x,y,z) dos polinomios homogéneos. Se dice que son proyec- 
tivamente equivalentes, o simplemente equivalentes, si existen t 4 0 y una transfor- 
mación lineal f : R — R3 tales que 


Oi=t(PoF 


Puesto que f se escribe en coordenadas como f (x) = (f; (x) ,f, (x) , f3 (x)) donde cada 
f, (¡=1,2,3) es una función lineal de la forma f; (x, y, z) = ax +b,y +Cc:z, entonces 
Po f se obtiene sustituyendo estos polinomios lineales en vez de sus tres variables y 
claramente resulta un nuevo polinomio homogéneo y del mismo grado. Así que la 
noción de equivalencia está bien definida y sólo hace equivalentes a polinomios de un 
mismo grado. 

Por ejemplo, si P(x,y,z) = 4 +vu?=z2* y O (xy) = x =y?=2 son los 
polinomios que vienen del círculo y la hipérbola respectivamente, entonces para ver 
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que son equivalentes tomemos f (x,y,z) = (Z,y,x) y t =—1, pues entonces 
E (Po f) (uz) = =1 (Pb yz) 
= —P(z,y,x) =- (2% +y?—x?) =Q (x,y,2)- 


Lema 7.2 Sean P (x,y,z) y Q (x,y,2) dos polinomios homogéneos equivalentes. En- 
tonces sus curvas algebraicas proyectivas C(P) y C(Q) son equivalentes. 


Demostración. Por hipótesis tenemos t 4 0 y una transformación lineal f : R? — R* 
tales que 


O=t(Pot). 
Abusando de la notación, pensamos que f también es función de 
la fórmula f ([x]) = [f (x)]. Demostraremos que f (E (Q)) =(€ (P). 


Supongamos primero que [x] € C(Q), entonces Q (x) = 0. Para ver si f ([x]) = 
[f (x)] € C(P), tenemos que evaluar a P en f (x): 


D2 


en sí mismo con 


P(f (x)) = (Po f) (x) =t1Q (x) =0. 


Por lo tanto f ([x]) e C(P) y concluimos que f (0 (Q)) EGP 
Supongamos ahora que [y] € C(P), ¡.e. que P(y) = 0; para ver que [y] € 
f (0 (Q)) debemos encontrar [x] € € (Q) tal que f ([x]) = [y]. Para esto, como f es 


transformación, tiene una inversa y podemos declarar x := f"! (y). Como y 4% O pues 
es un punto en P? y f7! es una transformación, x 4 0 y [x] € P? está bien definido. 
Nos falta ver que [x] está en C(Q), y para esto hay que evaluar 


Q (o) =t (Pof) (f” (y)) =tP (y) =0. 


Por lo tanto C(P) Cf (E (Q)) y queda demostrado el lema. [E] 


Sería muy bonito que el lema tuviera inverso, que fuera un teorema “si y sólo 
si”. Pero no es estrictamente cierto. Por ejemplo, si P fuera el cuadrado de un 
polinomio y Q el cubo, definen la misma curva pero no son equivalentes. También 
tenemos el problema de que los reales no son algebraicamente cerrados. Por ejemplo, 
en IP? el polinomio homogéneo x? + y? define el vacío (su única solución real es (0, 0), 
que proyectivamente no vale), así que el producto (x? + y?) (x+y) y el polinomio 
homogéneo lineal x + y definen al mismo punto [1 : —1] pero no son proyectivamente 
equivalentes ni potencias de un mismo polinomio. Lo que sí es cierto a grandes rasgos 
es que, sobre los complejos, si dos polinomios definen la misma “curva” entonces, 
salvo constantes, son potencias de algún otro. Éste es un teorema famoso conocido 
como el “Nullstellensatz” que habla sobre los ceros de polinomios. De nuevo, rebasa 
el ámbito de este libro. Pero no nos desanimemos, en ciertos casos (el cuadrático y el 
lineal) sí daremos la demostración pero hay que desarrollar más la teoría geométrica. 
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EJERCICIO 7.7 Demuestra que la equivalencia proyectiva de subconjuntos es una 
relación de equivalencia. 

EJERCICIO 7.8 Demuestra que la equivalencia de polinomios es una relación de equi- 
valencia. 

EJERCICIO 7.9 Demuestra que la hipérbola x?—y?—1 es proyectivamente equivalente 
al círculo x? + y? —1. 

EJERCICIO 7.10 Demuestra que hay una única clase de equivalencia de rectas. 


7.2 Formas cuadráticas 


Basta de generalidades. Concentrémonos en el caso de las curvas cuadráticas o cóni- 
cas. Una curva cuadrática en RR? está determinada por un polinomio de segundo grado 
que podemos expresar como 


P (x,y) = ax? + 2bxy + cy? + 2dx + 2ey +f. 


(Nótese que añadimos un 2 a los términos lineales, a diferencia del Capítulo 4, pues 
en un momento, al proyectivizar, se comportarán como términos mixtos con la nueva 
variable.) Su homogeneización es 


P (x,y,z) = ax? + 2bxy + cy? + 2dxz + 2eyz + fz?. 


Si tomamos un vector variable x = (x, y, Z), entonces podemos simplificar la notación 
como en el Capítulo 4. Este polinomio se escribe 


P (x) =x Ax=x-Ax, 


donde A es la matriz simétrica 
y) 


a b d 
A=| bc e 
de f 


pues (y aquí aparece la importancia de haber añadido 2 en los términos mixtos), 


a b d XxX 
x Ax = [xy z)J| bc e y 
d e f Z 

ax + by + dz 

= (x,y,z) | bx+cy+ez 

dx +ey +fz 


x (ax + by + dz) + y (bx + cy + ez) + z(dx + ey + fz) 
Pl Uz) 


... Dibujo 
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Llamaremos forma cuadrática a un polinomio homogéneo de grado 2. Por lo que 
acabamos de ver, la forma cuadrática general se escribe como 


P(x)=x!Ax con A=A!'; (7.7) 


y la única posibilidad de que no sea la homogeneización de un polinomio cuadrático en 
dos variables es que tenga la forma 2dxz+2eyz+z? = z(2dx + 2ey + z), cuya curva 
es un par de rectas y siendo una de ellas la del infinito. Así que conviene considerar 
el caso de una curva cuadrática proyectiva definida por una forma cuadrática en tres 
variables como en (7.7), donde le hemos quitado ya la tilde a P para simplificar nuestra 
notación. 

La matriz simétrica A que define una forma cuadrática es el paquete que lleva 
toda su información: los coeficientes. Veamos ahora cómo se traduce la equivalencia 
de polinomios en las matrices simétricas que los determinan. Tenemos que ver qué 
le pasa cuando precomponemos con una transformación lineal f : R? — R* que está 
definida como f (x) = Bx donde B es una matriz no singular. Se tiene 


(Pots). = P(5)= PP (Bx) 
= (Bx)' A(Bx)= (x'B") A(Bx) 
x' (B'AB) x. 


Lo cual implica que dos matrices simétricas A y A” determinan formas cuadráticas 
equivalentes si existen t 4 0 y B € GL(3) tales que 


A'=t (B'AB); 


diremos en este caso que A y A! son algebraicamente equivalentes. 

El problema de clasificar curvas cuadráticas proyectivas se reduce entonces a en- 
contrar las formas canónicas a las que podemos reducir matrices algebraicamente 
equivalentes. Pero antes de entrar de lleno en él, concluyamos un ejemplo importante 
que dejamos pendiente: el de la parábola. 

Sean P y su homogeneización P como en (7.5) y (7.6) respectivamente. Dicho de 
otra manera, su matriz asociada es 


1.8: 
A=4|.0 <0 =1 
o =1 0 


Sabemos que € (P) es un cono circular (ver Ejercicio 7.4) y además que es tangente 
al plano z = 0 (y también al y = 0). Isométricamente es igual al cono del círculo 
unitario; y la isometría que lleva a este último en C(P) es la rotación de —45* alrededor 
del eje x. Sea B la matriz de esa rotación, es decir 


1 v2 0 0 
B==H| 0 1 1 
V2X O 37 
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Tenemos entonces, de acuerdo con la demostración del Lema 7.2, que 


¡(v2.0 0 VD. 0 v2 00 
BAB=5 1.1 0” Y *=] O “1d 
A Or =1. 50 ES | 

¡[v2.0 0 vV2 0 0 

y 0 El 0 E <= 

0 1 1 0 .=1 -=1 

1 (200 10.0 

A a EUR: 

0.0 =2 0.:0:==1 


es la matriz del cono de S', al que llamaremos el cono de Lorentz. 

Junto con el Ejercicio 7.9, tenemos entonces que la hipérbola, la parábola y el 
círculo son proyectivamente equivalentes. Lo que afinmente las diferencía es cómo 
intersectan a la línea al infinito: la hipérbola en dos puntos (correspondientes a la 
dirección de sus asíntotas), la parábola en uno (correspondiente a su directriz) y el 
círculo en ninguno. 


7.2.1 Clasificación usando a la afín 


Puesto que el grupo afín Af (2) se puede considerar naturalmente dentro del grupo 
general lineal, Af (2) € GL(3), como las matrices de la forma 


( a ) (7.3) 


donde B' € GL (2) (la parte lineal) y k € R? (la traslación), actuando en el plano 
z = 1 (ver Sección 6.6.4); entonces podemos usar la clasificación afín del Capítulo 4 
para dar la clasificación proyectiva. Esta clasificación es tanto de formas cuadráticas, 
como de sus curvas algebraicas y sus matrices simétricas asociadas. Enunciémoslo 
en términos de matrices, aunque en la demostración hablaremos indistintamente de 
estos tres tipos de objetos hermanados. 


Teorema 7.3 Una matriz simétrica 3 x 3 distinta de cero es algebraicamente equiv- 
alente a una y sólo una de las siguientes 


0050 10.0 
ototlo1ol, 
0.01 0.0 -1 

¡SR 10.0 100 

o1tollpo-10ÍjÍo000 

000 0.0.0 0-00 
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Demostración. Sabemos que afinmente se reducen a nueve (ver Sección 4.2), es 
decir, que actuando únicamente con matrices afines (7.8) llegamos a nueve formas 
canónicas. Pero ya hemos visto que tres de ellas (círculo, parábola e hipérbola) 
son proyectivamente equivalentes (para hacerlas equivalentes se usan necesariamente 
matrices no afines). De tal manera que las no degeneradas de la primera línea son dos: 
la forma cuadrática definida (o euclidiana) cuya curva es vacía, y la forma cuadrática 
de Lorentz que define a la cónica proyectiva no degenerada (representada por la forma 
cuadrática del círculo unitario). 

Las formas degeneradas son las tres del segundo renglón. La primera tiene como 
curva un único punto, el [0: 0: 1]. En ella se han fundido lo que habíamos llamado 
“el círculo de radio cero” (x?+y?) y “las rectas paralelas imaginarias” (x? +1), que, 
al homogeinizarse en x? + 2?, sí tiene un punto al infinito. La segunda es un par de 
rectas (antes eran dos casos: paralelas y no que en el proyectivo son lo mismo). Y 
por último, una recta doble. 

Puesto que los subconjuntos del proyectivo asociados a estas matrices (las cur- 
vas de sus respectivas formas) son todos de distinta índole, no es posible que sean 
equivalentes. Y esto concluye la demostración. Ol 


Podría parecer que hemos acabado nuestro trabajo de clasificación de curvas 
cuadráticas proyectivas, y en principio así es. Pero repasemos la demostración que 
dimos en el fondo. La clasificación afín. Consistió en reducir el polinomio general a al- 
guno de los canónicos en dos pasos centrales pero independientes. Primero, encontrar 
un centro (para eliminar términos lineales) por medio de una traslación, y, segundo, 
encontrar los ejes (para eliminar términos mixtos) por medio de una rotación. Lo 
demás fueron detalles, se reescalaron los ejes coordenados y se multiplicó por la con- 
stante si fuera requerido para hacer de todos los coeficientes 0, 1 o —1; y finalmente, 
se permutaron variables. 

Al proyectivizar y homogeneizar el polinomio nos hemos “deshecho” de los térmi- 
nos lineales y el constante; ahora todo es cuadrático, entonces parece que podríamos 
evitar el primer paso, y hacerlo todo de golpe con la rotación. Esto nos dará una 
demostración más elegante, cuyas ventajas serán múltiples. Por un lado nos dará una 
idea general de cómo deben ser las superficies cuadráticas en todas las dimensiones, y 
por el otro, un entendimiento más profundo de las formas cuadráticas que redundará 
en conocimientos concretos sobre las cónicas y en nuevas geometrías. 


7.2.2 Equivalencia lineal 


Sea A una matriz simétrica 3 x 3 y P su forma cuadrática asociada, es decir, 


P(x)=x'Ax=x-(Ax) con A! =A. 


Para entender con más precisión qué hace esta forma cuadrática en R?, y en particular 
cómo es la geometría de su cono asociado C(P), actuaremos en ella, no a lo bestia 
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con matrices cualesquiera de GL (3) como en la sección anterior, sino con más tacto, 
con las que preservan el producto interior y por tanto la métrica. Sabemos que estas 
matrices son las matrices ortogonales (que forman el grupo O (3)) y que también 
preservan la métrica de P?. 

SiB€0(3), y f: R? — RR es su transformación asociada, tenemos que 


(Pati == (BABIX; 


como para cualquier matriz B. Pero en este caso especial (B € O(3)), la matriz 
B'AB tiene una interpretación geométrica muy particular. Puesto que 


BEe0(3) eS BT=B", 


entonces B' AB = B!AB y esta matriz es la matriz asociada a la transformación A 
pero escrita en la base B. 

Veámoslo. Si B tiene columnas u;, u,, uz, entonces el que sea invertible significa 
que estos tres vectores forman una base, es decir, que cualquier vector x € R3 se 
puede escribir como 


x= Bu + Bu + Pzuz. (7.9) 


Definimos xg := ((81,827,83) como la expresión de x en la base B. Así que, por ejemplo, 
u, en la base B es (1,0,0) = ey; pero u; en la base canónica puede ser complicado. 
Para pasar de la expresión en la base B a la expresión en la base canónica, simplemente 
hay que multiplicar por B, pues equivale a calcular los valores reales de las coordenadas 
en la expresión (7.9), que se puede reescribir como x = Bxg. Y al revés, para pasar 
de la expresión en la base canónica a la expresión en la base B hay que multiplicar 
por la inversa B”!, pues es la manera de encontrar la solución de (7.9) pensado como 
sistema de ecuaciones con incógnitas (31,B2,$3; puesto que x = Bxg, tenemos que 
x = B7Ix. En el ejemplo, está claro que Blu; = e;. Así que la matriz B'AB 
pensada como transformación aplicada a un vector escrito en la base B, primero lo 
reescribe en la base canónica, luego le aplica A (que es como ella sabe actuar) y luego 
lo traduce de nuevo a la base B. Con la notación que desarrollamos en el párrafo 
anterior, esto se escribe 


(B"AB) xp =B'A (Bxp) =B'Ax =B"! (Ax) = (Ax)p . 


Hemos demostrado que B7!AB es la matriz de la transformación A escrita en la 
base B. Es natural entonces decir que dos matrices son linealmente equivalentes si 
expresan la misma transformación pero en diferentes bases, es decir si son A y B AB 
para alguna B € GL (3), pues obsérvese que en nuestra discusión de la escritura en 
diferentes bases sólo usamos que B fuera invertible. Si, en particular, B € O (3), 
que es el caso que nos interesa, entonces se dice, aún más, que A y B!'AB son 
ortogonalmente equivalentes. 

Hay que remarcar que la equivalencia lineal no corresponde a la equivalencia 
algebraica que estamos estudiando (de ahí que haya sido necesario poner apellidos), 


...Diujo 


Dibujo... 
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pues en general B'AB 4 B'AB. Sólo en el caso especial en que se actúe con las 
ortogonales (cuando B € O (3), y que cumple que su inversa es su transpuesta), sí 
coinciden. Es decir... 


Lema 7.4 Si dos matrices simétricas son ortogonalmente equivalentes, entonces son 
algebraicamente equivalentes. Ol 


Podemos entonces pensar a A como función lineal y no como forma cuadrática 
para simplificarla ortogonalmente. 
7.3 Diagonalización de matrices simétricas 
Esta sección está dedicada a demostrar lo siguiente. 


Teorema 7.5 Sea A un matriz simétrica. Entonces es ortogonalmente equivalente a 
una matriz diagonal, es decir, existe una matriz ortogonal B tal que 


Mm 0.0 
BAB=| 0 M0]. (7.10) 
0 0 2 


Y para demostrarlo podemos pensar a A como función lineal (o proyectiva) pues 
como B € O(3), B” = B”' y entonces la matriz B' AB representa a la función 
A escrita en otra base. Que en esta nueva base sea diagonal, como vimos en la 
demostración del Teorema de 4 en 4, significa que, proyectivamente, fija los tres 
puntos de la base; y euclidianamente, que alarga (o acorta) a sus ejes, que los deja 
en sí mismos. Para encontrar a B buscamos entonces puntos fijos de la función A 
(proyectiva); o bien, vectores propios de la función lineal. 

Recordemos de la Sección 4.3.2, como de hecho gran parte de la discusión anterior 
ya lo hace, que un vector propio de la matriz A es un v € R* distinto de O para el 
cual existe una A € R, su valor propio, tal que 


Av = Av, 


y a la pareja v,A la llamaremos un par propio de A. Si 1 H 0, [v] es un punto fijo 
de A (pensada como transformación proyectiva), y si A= 0, es un “punto de proyec- 
ción” donde no está definido su valor. "También vimos en 4.3.2 que para encontrar 
pares propios, primero se encuentra un valor propio como raíz del polinomio carac- 
terístico y luego se encuentra una solución no trivial al sistema de ecuaciones lineales 
correspondiente. Como en aquel entonces trabajábamos en R?, reconstruyamos la 
argumentación en IR? haciendo énfasis en qué se necesitaría para el caso general. 


Lema 7.6 Dado A € R, entonces existe v 4 O tal que Av = Av si y sólo si 
det (A —Al) =0. 
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Demostración. Tenemos que 


Av = Av 
5S4Av—Av=0 
5 (A-A)v=0. 
Y la última ecuación sucede con algún v 4 O si y sólo si det (A — AI) = 0 (ver el 


Teorema 5.9 para el caso en R*, y esto es lo que se necesita demostrar en el caso 
general). O 


Dibujos... 
Regresemos al ejemplo de la parábola con esta óptica. Si A es la matriz de la 
parábola, det (A — AI) toma la forma 


1.0.0 A00 1-A 0 0 
det a E O e = det 0 —A -—1 
0-1 0 OO A A ES 

= (1-3 (4-1) 


= AM=DApm, 


Lo cual nos dice que los valores propios de A son 1 y —1 pues son las raíces de este 
polinomio (los valores de A que lo anulan). Para el valor propio —1, se tiene entonces 
que el sistema de ecuaciones homogéneas 


20.0 x 0 
0. 1-1 dll de 
es z 0 


tiene soluciones no triviales, a saber cualquiera de la forma (0,t,t) con t % 0, corre- 
spondientes al vector propio u := (0,1,1) (Au = —u) y al eje de simetría del cono. 
Por su parte, el valor propio 1, que tiene multiplicidad 2, da el sistema 


0 0-0 x 0 
E vi=l0 
Ml 1 z 0 


cuyas soluciones son todos los puntos del plano y + z = 0; que es el plano de simetría ...Dibujo 
del cono. Proyectivamente, la recta y + z = 0, que es precisamente fly se queda 
fija punto a punto, de tal manera que la matriz A representa la reflexión en fi, que 
también es la inversión en su polar [ul. 
Regresando al caso general, el lema nos dice que los valores propios de la matriz 
A son las raíces (los ceros) de su polinomio característico 


det (A—AD, 
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donde se piensa a A como una variable. El polinomio característico de una matriz no 
cambia cuando la escribimos en otra base, pues para cualquier B € GL (3): 


det (BABA) = det ((B”'AB) —A(B”'B)) 
= det ((B'AB) — (B' (AD) B)) 
= det (B' (A—AI) B) 
= det (B” Ei (A — AI) det (B) 
= det (A—Al). 


Así que diagonalizar una matriz (como en 7.10) incluye necesariamente encontrar las 
raíces de su polinomio característico, pues entonces se tiene por lo anterior que 


det(A—AD = (A1-2M(A-—AM(2A3-—A) 
(AA) (A=22) (A—A3), 


que es escribir el polinomio en términos de sus raíces. 

Si A es una matriz 3 x 3 (como en el caso que nos interesa), éste es un polinomio 
de grado 3, y por el Teorema Fundamental del Algebra,? tiene al menos una raíz real. 
En realidad lo que dice este teorema es que tiene tres raices complejas, pero si sus 
coeficientes son reales, como en nuestro caso, entonces las raíces complejas vienen en 
parejas; un complejo y su conjugado. Como el grado es impar, entonces hay al menos 
una raíz real. Hemos demostrado entonces lo siguiente. 


Corolario 7.7 Toda matriz de 3 x 3 tiene al menos un par propio. O 


Ahora, usaremos la simetría de A para aplicar inducción encontrando un plano 
“invariante” y buscar ahí los dos pares propios que nos faltan. En general, dada una 
matriz cuadrada A se dice que un subespacio V es invariante si se cumple que 


xeV > AxecvV. 


Es decir si la función A lo deja en su lugar (aunque posiblemente cambiado interna- 
mente). El ejemplo básico de espacios invariantes corresponden a las líneas generadas 
por los vectores propios, pues la condición Av = Av implica que [v] es invariante y 
viceversa, una línea (por el origen) invariante consta de vectores propios. 

Recordemos del Capítulo 4 la caracterización de las matrices simétricas como 
aquellas que “saltan” en el producto interior. Por su sencillez, y para que quede 
autocontenida nuestra discusión, lo volveremos a demostrar. 


Lema 7.8 Sea A una matriz de n x n. Entonces 


A=A!' O (Ax)-yu=x-(Ay) VxyeR”. 


2Ver Apéndice. 
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Demostración. Para la ida (>>) se usa que el producto interior es un caso particular 
del producto de matrices y su asociatividad. Para cualquier x, y € IR”, 


(Ax) -y =(Ax) y=(x"A')y=(x"A)y=x' (Ay) =x- (Ay). 


Para demostrar el otro lado (+), basta ver que la entrada 1,j de A es e; - (Ae;). Por 
hipótesis, e; - (Ae;) = e; - (Ae;), que es la entrada j,1, así que A es simétrica. O 


Hay que hacer resaltar que la condición de ser simétrica, para una transformación, 
se ha expresado en términos del producto interior. Así que si tiene un subespacio 
invariante, se puede decir cuándo es simétrica en él y éste será el fundamento de la 
inducción después de encontrar el plano invariante. 


Lema 7.9 Sea A una matriz simétrica (A = A') y v un vector propio de A. En- 
tonces el plano ortogonal a v es un espacio invariante de A; es decir 


xv=0 => .(AX):4=0, 


Demostración. Si v un vector propio de A se tiene que Av = Av para alguna A € R, 
y entonces X - v = 0 implica que 
(Ax) -v=x-(Av) =x- (Av) =A [x - v) =0. 
O 


Ya tenemos todos los ingredientes para demostrar el Teorema de diagonalización 
ortogonal de matrices simétricas. 

Sea A una matriz simétrica 3 x 3. Por el corolario 7.7, A tiene un valor propio 
Az. Sea uz un vector propio unitario correspondiente a Az (cualquier vector propio 
multiplicado por el inverso de su magnitud lo hace unitario). Sean v¡ y vz cualquier 
par de vectores tales que v¡,v,, uz forman una base ortonormal. Puesto que v¡ y 
v, son ortogonales a uz, el Lema 7.9 nos dice que Av; y Av, también lo son, de tal 
manera que A escrita en la base v;,v,, uz tiene la forma 


ab 0 
Al De 0 ds 
0 0 2 


pues b = v; - Av, = v, - Av¡. Como lo demostramos en el Capítulo 4, se puede ver 
directamente que el polinomio característico de esta matriz tiene sus otras dos raíces 
reales (ya nada más falta resolver un polinomio cuadrático). Que, como no cambia el 
polinomio característico, son valores propios de la matriz original. Sean A, y Az estas 
raíces y sean u¡ y u, sus vectores propios unitarios correspondientes. Nos falta ver 
que son ortogonales. 


Dibujo... 


...Dibujo 


326 CAPÍTULO 7. CÓNICAS III (PROYECTIVAS) 


Por ser A simétrica, 
A; (uu) = (Au) -u, = (Au) -u; =u; - (Au) =u, - (Ayu) = y (u - uy), 


lo que implica que (A; — A;) (u; - u;) = 0. Por tanto, tenemos que si A; 4 A; entonces 
u; es ortogonal a u;. Si dos valores propios coincidieran, podemos suponer que son 
AM y Az, pero entonces la matriz A” ya sería diagonal pues A en el plano invariante es 
una homotecia. Y si los tres valores propios coinciden, entonces A es una homotecia 
en IR3 y desde el principio es diagonal. 

Con esto se concluye la demostración del Teorema de diagonalización 7.5. 


7.4 Geometría de las formas cuadráticas 


Resumiendo las dos secciones anteriores, a una forma cuadrática en tres variables le 
asociamos una matriz simétrica A y hemos demostrado que en una base ortonormal 
adecuada u;, u2, uz, ésta se escribe como una matriz diagonal 


Amo 0 
0» 0 
0 0 2 


Lo cual dice que, en la nueva base, la forma cuadrática se expresa de manera muy 
simple: 
P(x) =2A1x2 + Ay? + 232, 


donde (x,y,z) son ahora las coordenadas de x respecto a la base B = (u;¡,u,, uz). Se 
tiene además que el determinante de la matriz original es el producto de sus valores 
propios (det (A) = A122A3). Entonces se puede saber desde el principio si alguno 
de los valores propios es cero, simplemente corroborando si det (A) es cero. A este 
caso se le llama degenerado pues, en la base adecuada, no depende de alguna de las 
coordenadas; viene, por decirlo así, de algo en una dimensión más baja y hay al menos 
una variable de pacotilla; es un “cilindro” sobre los ceros de una forma cuadrática de 
dimensión menor. 

El caso interesante es el no degenerado, cuando det(A) 4 0. Y éste se divide 
en dos subcasos. Primero, cuando los tres valores propios tienen el mismo signo 
es llamada forma cuadrática definida, pues el valor de la forma cuadrática siempre 
tendrá el mismo signo (excepto en el O que vale 0). Si fueran positivos, por ejemplo, no 
importa qué valor le demos a las variables, al elevarlas al cuadrado se harán positivas 
y estaremos sumando tres números positivos; se le llama entonces positiva definida. 
Cuando los tres son negativos se le llama negativa definida. Puesto que el único cero 
de las formas cuadráticas definidas es el origen, su curva proyectiva asociada es vacía. 

La otra posibilidad para una forma cuadrática no degenerada es que entre los 
valores propios aparezcan los dos signos, y se le llamará indefinida. Dos de los valores 
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propios son de un signo y el restante del contrario; podemos suponer (cambiando 
el orden de la base si fuera necesario) que los dos primeros A y A2 son del mismo 
signo, y además, para fijar ideas, que son positivos (el otro caso será equivalente si se 
intercambian las palabras “positivo” y “negativo”). Éstas son las formas cuadráticas 
que definen a las cónicas proyectivas. En R* sus ceros son un cono sobre una elipse. 
Demostrémoslo. Su intersección con el plano z = 1 (recordemos que estamos en la 
base B y no necesariamente en la canónica) está determinada por la ecuación 


Mx? +2y? =(—M), 


donde las tres constantes son positivas, y por lo tanto es una elipse. Entonces C(P) 
consiste de todas las rectas por el origen y puntos de esta elipse. 


7.4.1 Su simetría 


Los tres ejes [uy] ,[uz], [uz] de la forma cuadrática rigen su simetría (y al revés). 
Como hemos visto, se puede definir un subgrupo de O (3) para cualquier figura que 
son sus simetrías. También se puede definir para funciones en general, pero en nuestro 
caso particular definámoslo para la forma cuadrática que estamos estudiando: 


Sim (P) =(f€ O(3)|P=Pof;. 


Aquí consideramos a los elementos de O (3) como funciones, y estamos tomando 
aquellas que, al precomponerlas con la forma cuadrática, ésta ni se entera. Cualquier 
cosa que definamos con base en P, por ejemplo sus ceros o sus superficies de nivel que 
estudiaremos más adelante, heredarán esta simetría. 

Si llamamos f; a la reflexión en el plano generado por u; y Ux donde (i,j,k) = 
(1, 2,3), entonces se escribe en coordenadas (respecto a B, insistimos) cambiando el 
signo a la coordenada 1. Por ejemplo f¡ (x,y,z) = (—x,y,z). Está claro entonces que 
f¡ € Sim (P) pues como la coordenada en cuestión se eleva al cuadrado al evaluar 
P, el cambio de signo no altera el resultado. Cuando los tres valores propios A¡,A2 y 
Az son diferentes, entonces f¡,f2 y f3 generan a Sim (P) y este tiene ocho elementos. 
Las rectas [uy], [uz] y [uz] están entonces determinadas por la geometría —por la 
simetría— y por ello se les llama ejes de simetría. 

Cuando dos de los valores propios coinciden, digamos que A¡ = Aj, entonces 
el grupo de simetrías crece. El plano generado por uy y u, es un espacio propio; 
cualquier vector ahí es vector propio para el valor propio A¡. Entonces u¡ y u> 
pueden escogerse como cualquier base ortonormal ahí y habrá un subgrupo O (2) de 
Sim (P). En el caso de una forma cuadrática no degenerada indefinida ésta es la 
simetría máxima a la que puede aspirar (como en la forma cuadrática de Lorentz). 
De cualquier manera el plano de simetría queda determinado. 

Cuando los tres valores propios coinciden (y por lo tanto es definida la forma 
cuadrática, de hecho una constante por la forma cuadrática euclidiana) la simetría es 
todo O (3). 


Dibujo... 


Dibujo... 
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EJERCICIO 7.11 Sean A una matriz simétrica 3x3 y B € O (3) una matriz ortogonal. 
Si P es la forma cuadrática asociada a A y f la transformación lineal asociada a B (f(x) = 
Bx), demuestra que P=Pof si y sólo si A=B7!AB. 

EJERCICIO 7.12 Sean A = (Ae1,22€e>,1383) una matriz diagonal y B = (v;,v,v3) 
€ O(3) una matriz ortogonal, tales que A = B'AB. Demuestra que si A,,A2 y Az son 
diferentes, entonces v; = +€; para i=1,2,3. 


Ejemplo 


Consideremos un círculo unitario desplazado una unidad en el eje y; estudiaremos su 
cono por el origen al pensarlo en la carta coordenada canónica. El círculo está dado 
por el polinomio 


Pu =*+(y-D?-1=x +y?-2. 


Al homogeneizar, su matriz asociada es 


¡E 
ASNO 
=P 


cuyo polinomio característico resulta ser 


det (A—AD = (1-1) (-M -— (1—A) =-—M +22 —1. 


En general no supondremos que sabemos resolver polinomios de tercer grado, pero en 
este caso, de la expresión intermedia está claro que se puede factorizar el factor lineal 
(1 —A) para obtener 


det (A—A1) = (1—A) (A2—=A—1). 


Tenemos entonces que una raíz del polinomio característico (o valor propio de A) es 
1. Su vector propio asociado es e; = (1,0,0), que corresponde al hecho de que al 
trasladar el círculo en el eje y, el plano de simetría del cono gira sobre el eje x. Las 
otras dos raíces son: 

1+45 


.” 


El valor propio $ = (7 + v5) /2 es la razón áurea y el que falta es la no tan famosa 


solución negativa del polinomio áureo A? — A— 1, que resulta ser —Q 7! pues 


1+45Y [1-45] 1-5 : 
2 2 E AS 
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...Dibujos Para encontrar un vector propio para b debemos resolver el sistema 
1=Q 0 0 pS 0 
0 l-g -—1 =p 
0 1 —p a 0 


que nos da, usando el truco del compadre ortogonal en el segundo renglón de la matriz, 
la solución 


u:=(0,1,1—Q). 
Efectivamente, del polinomio áureo obtenemos que $7? = y — 1, y por lo tanto 
10.0 0 0 0 
Au=|0 1 -—1 1 = 10) =p 1 = qu. 
0-=1.:0 1-4 = =p 


Así que el plano de simetría del cono tiene pendiente —p”!. El tercer vector propio, Dibujo... 

asociado al valor propio —q”', se puede obtener de manera análoga, o bien por el 

producto cruz (pues sabemos que son ortogonales); es v := e; x u = (0, 9,1). 

Obsérvese que el eje de simetría del cono no pasa por el centro del círculo original 

que es (0,1,1). Este ejemplo demuestra que el centro, aunque es un invariante afín 

de las cónicas, no es un invariante proyectivo, es decir, proyectivamente no está bien 

definido. Con una simple traslación, el eje de simetría del cono no se traslado lo 

mismo, se “atraso” en proporción áurea. Y lo que era un cono circular se vuelve un 

cono elíptico. Dibujo... 
Por la teoría que desarrollamos, sabemos además que al cambiar coordenadas 

girando en el eje x para que el eje y caiga en [u] (y, por tanto, el eje z cae en [v]), la 

forma cuadrática se expresa 


x? + dy? e pz. 


Así que el origen “ve” al círculo (en el plano a distancia 1 de él y encuadrando la 
imagen) como la elípse 


dx + ty? =1. 


EJERCICIO 7.13 Considera el círculo unitario trasladado una distancia t > O a lo largo 
del eje y (en el ejemplo desarrollamos el caso t = 1). Encuentra los ejes de simetría del 
cono correspondiente y sus valores propios. Supón que el parámetro t representa el tiempo, 
¿cómo se parametriza la familia de elipses que ve el origen si gira para seguir el movimiento 
del círculo? ¿Puedes demostrar que el único momento en que el centro del círculo se ve en 
el centro de la “elipse visual” es t = 0? 
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7.4.2 Reducción final 


Teniendo el Teorema de Diagonalización de Matrices Simétricas en nuestras manos, 
podemos dar una demostración alternativa del Teorema de Clasificación 7.3. Simple- 
mente se reduce a convertir una matriz diagonal 


Mm 0-0 
A=| 0 » 0 
0 0 2 


en una de ceros, unos y menos unos. Esto ya no se puede hacer con transformaciones 
ortogonales, pero se logra fácilmente reescalando los ejes coordenados. Suponiendo 
que A es no degenerada (las tres A distintas de cero), la matriz de cambio de escalas 
que lo logra es 
AF 0 0 
B=| 0 mr? 0 
0 o Ap? 


Pues es fácil ver que entonces B' AB es, salvo permutación de las variables y signo, 
una de las dos matrices no degeneradas del Teorema 7.3. 


7.5 Clasificación en P? y en R* 


7.5.1 Resumen de cónicas en P? y en R? 


En resumen, hemos demostrado que en el plano proyectivo hay una única cónica no 
degenerada y no vacía. Las tres cónicas clásicas en el plano afín aparecen porque hay 
tres tipos de líneas respecto a una cónica proyectiva dada: las que no la intersectan; 

las que la tocan en un sólo punto, llamadas sus tangentes, y las que la 


intersectan en dos puntos. Ello corresponde al hecho de que los poli- 
nomios cuadráticos en una sola variable tienen dos raíces complejas 
(conjugadas), una real de multiplicidad dos o bien dos raíces reales. 
Cuando una recta se manda al infinito para obtener una carta afín, 
dependiendo de qué tipo de recta sea respecto a una cónica dada, 
ésta se convierte respectivamente en elipse, parábola o hipérbola. 


7.5.2 Dimensión 3 


Sin entrar en detalles, describiremos la clasificación de superficies cuadráticas en [P? 
y en ¡R3 que, a su vez, delinea una generalización natural a todas las dimensiones. 
En R?, una superficie cuadrática es el conjunto de ceros de un polinomio de grado 
dos en tres variables. A éste se le hace corresponder un polinomio homogéneo de 
grado dos en cuatro variables cuyos ceros definen una superficie cuadrática en P* que 
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es su cerradura proyectiva; agrega sólo puntos en el plano al infinito. A cualquier 
polinomio homogéneo de grado dos (o forma cuadrática) en cuatro variables se le 
asigna de manera única una matriz simétrica A de 4 x 4, de tal manera que se escribe 


P(x)=x'Ax, 


donde ahora x! = (x,y,z, w). 

Clasificar proyectivamente las superficies cuadráticas equivale a encontrar formas 
canónicas a las cuales se puede reducir la matriz A utilizando la acción de GL (4) 
dada por A+ B'AB con B € GL (4). Primero se estudia el caso particular de actuar 
por matrices ortogonales (en O (4)), que cumplen B' = B”!, y entonces esta acción 
equivale a escribir A en otra base ortonormal. Diagonalizar A de nuevo es el prob- 
lema de encontrar valores y vectores propios. Análogamente a como procedimos, este 
problema se reduce a encontrar un valor propio real de A, o bien, algún subespacio 
invariante para aplicar lo que ya sabemos ahí (usar inducción). En esta dimensión 
se complica pues el polinomio característico es de grado par y no da en forma tan 
automática un valor propio. Pero si suponemos que las matrices simétricas son di- 
agonalizables por cambio de base ortonormal (lo que además es cierto en cualquier 
dimensión aunque en este libro no nos toca demostrarlo), entonces prosiguiendo con 
un simple cambio de escala, una posible permutación de variables y, si fuera nece- 
sario, multiplicando por —1, obtenemos que la matriz A es equivalente a alguna de 
las siguientes: 


1000 100.0 10: 0 0 
0100 0 TA 01.0 0 
A A E E A E O A O E 
00.01 000 -—1 A 


o bien es degenerada; es decir, una de las del Teorema 7.3 con una columna y un 
renglón más de puros ceros. 

La primera corresponde a una forma cuadrática definida (sólo se anula en el origen 
de IR*) que define al vacío en IP. La segunda define a la esfera unitaria en el ¡R* 
canónico, w = 1. Este es el caso análogo de la cónica no degenerada en P?, que 
podríamos llamar elipsoide. Pero tenemos un caso nuevo, la tercera que define un 
hiperboloide reglado y que abajo estudiaremos con más detenimiento. Así que 


en P* hay dos tipos de superficies cuadráticas no degeneradas no vacías. 


La clasificación en I¡R3 surgirá entonces de cómo se relaciona un plano, que man- 
daremos al infinito, con la superficie. 

Del elipsoide proyectivo surgen tres superficies en R?. Cuando el plano no la 
toca es un elipsoide común y corriente. Cuando el plano es tangente, se obtiene 
un paraboloide que se aproxima al infinito en una dirección dada, la directriz, y las 
secciones con planos ortogonales son elipses similares; en general, sus secciones por 


Dibujos 


Dibujo... 
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planos son elipses excepto con los que contienen a la directriz que dan parábolas. Y 
finalmente, cuando el plano corta el elipsoide obtenemos el hiperboloide de dos hojas, 
cuyas secciones son hipérbolas o elipses. 

Del hiperboloide reglado se obtienen dos superficies. Cuando el plano al infinito 
lo corta en una cónica no degenerada da el “equipal”, conocido técnicamente como 
hiperboloide de una hoja. Y cuando el plano al infinito es tangente a él, lo intersecta en 
dos rectas (una cónica degenerada) y, entonces, vemos en el espacio afín un paraboloide 
hiperbólico. 


7.5.3 Superficies regladas 


Considerando los elipsoides como la generalización natural de las elipses, en dimensión 
3 aparecen nuevas superficies cuadráticas que son las “regladas”. Se llaman así porque 
tienen dos reglados que son conjuntos de rectas, o reglas, parametrizadas por una línea 
proyectiva. Consideremos primero el polinomio 


P (x,y,z) =*+y-ot?=1 


que, en R*, define al hiperboloide canónico (de una hoja) que denotaremos H. 

Observemos primero que H es invariante bajo rotaciones en el eje z (es decir, que 
O (2) € Sim(H)). Pues el propio polinomio P es invariante bajo ellas. Se puede 
ver sustituyendo directamente las fórmulas en las variables del polinomio, o bien 
matricialmente (viendo que B'AB =A): 


cosg8 sen8 0 O 100.0 cosg8 —sen9 0 O 
—sen8 cose 0 0 4 0.0 sen98 cosg8 0 0 | — 
0 0 10 00-10 0 0 Top 
0 0 01 00 O —1 0 0 o 1 
100.0 
po0o1 0.0 
(00-10 : 
00 0 —1 


donde la matriz de enmedio, llamémosle A, es la matriz asociada a 
la homogeneización de P y las otras, B' y B son las que representan 
las rotaciones en el eje Z. 

Observemos también que H contiene a las rectas 


l, =[e, +t(e,+e3)[teR) y L=[e1+s(ez-e,)|seR), 
P(1tt0)=1+t-t-1=0 y P(l,-s,s)=1+8%'-st-1=0. 


Estas rectas, l; y l2 , son las reglas de H que pasan por ej. 
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De estas dos observaciones se sigue que todas las rotaciones alrededor del eje z 
de la línea f; (y de £,) están en H; de hecho, “barren” a H: al rotar fl; (o (7) se 
“genera” o se “pasa por” todo H. Las rotaciones de fl; forman uno de los reglados, 
RR denotémoslo; y las rotaciones de l, forman el otro reglado R¿. Se tiene que, 
proyectivamente, las reglas de uno y otro reglado siempre se intersectan, mientras 
que las reglas de un mismo reglado son ajenas entre sí (no se intersectan). De hecho, 
por cada punto de H pasan justo una regla de Ry y una de R , que juntas generan 
el plano tangente a H en ese punto. 

Para demostrar, más que simplemente enunciar, nuestras últimas aseveraciones 
conviene ver el hiperboloide H en su otra manifestación afín. Para esto, consideremos 
a /H como el hiperboloide reglado proyectivo (es decir, en P3), definido por el polinomio 
homogéneo 

P (x,y,z,w) =x +y?-2—w, 
cuya matriz asociada A es la que ya usamos. Un cambio proyectivo de coordenadas, 
que geométricamente consiste, en R*, en rotar 45” en los planos xz y yw al mismo 
tiempo (y en P3 de medios giros en las rectas correspondientes), nos cambia a la 
matriz en 


0-1 10.00 1.010 

rpo1t.o -1 01.00 po 1 01]] 

| 10 10 a Rl- 0 10||7 
orto 71 000 0 A NS A 
0 =1 0 10 1:00 0010 
11o1 =1 otro 1]| [ooo01 
A oo lil l10001* 
0 1 1 010- 0100 


que corresponde al polinomio homogéneo 20, donde 


Q (x, Y, Z, w) A xZ + yw. 


jaja 
A 
SS m 
SS 


Este polinomio es la homogeneización de 


QU, 2] =x2+Y, 


que define un paraboloide hiperbólico, o “silla de montar” 
pues parece tal al intercambiar las variables y con z. Sus 
dos reglados están claramente determinados por sus intersecciones con los planos 
z = Cte y x = cte; y que tienden al par de rectas xz = 0 en el plano al infinito. 


*El hiperboloide por tres rectas 


Una construcción elegante de superficies cuadráticas regladas con la que Hilbert y 
Chon-Vossen abren su libro clásico Geometría e Imaginación [9], es la siguiente. 


...Dibujo 
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m3 


Consideremos tres rectas l;, l,, l3 en P? en posición general, ¿.e., que no se intersecten 
dos a dos (aquí formalmente es importante estar pensando en términos proyectivos 
para excluir la posibilidad euclidiana del paralelismo y definir de un solo golpe la 
construcción). Para cada punto p € f¡, tomamos el plano que genera junto con l, y 
lo intersectamos con f3 para obtener un punto q € l3; la línea, (,, que pasa por p 
y q también intersecta a l pues son coplanares, así que intersecta a las tres líneas. 
Al variar p € l; se obtiene un reglado de un hiperboloide H, y f1,f>,l3 pertenecen 
a su otro reglado. Nótese que cualquier recta que intersecte a las tres dadas aparece 
como la (, de algún punto en f¡, así que los hiperboloides reglados constan de todas 
las rectas que tocan a tres rectas dadas. 

Es claro que en la construcción anterior pudimos haber utilizado las tres rectas 
en cualquier orden y obtener el mismo H con su reglado de “transversales” a ellas. 
Este reglado implica que, al tomar tres rectas en posición general en [P*, se obtiene 
naturalmente una correspondencia entre ellas (p; € l; corresponde a p; € fl; si están en 
una de las reglas de H). Resulta que estas correspondencias entre líneas proyectivas 
son proyectivas. Así que otra manera de obtener hiperboloides reglados es con dos 
rectas l; y fl, en posición general y una correspondencia proyectiva f : l1 —= la, 
tomando todas las reglas por p € l¡ y f(p) € l%,. En el Capítulo 9 veremos algo 
similar a esto en el plano. 


“EJERCICIO 7.14 Demuestra, o indica un esbozo de demostración de, que la unión de 
las líneas l, con p € fi (que llamamos H arriba) es efectivamente una superficie cuadrática; 
es decir que está definido como los ceros de un polinomio homogéneo de grado 2. 


“EJERCICIO 7.15  Delinea una demostración de que es proyectiva la correspondencia 
dada por el reglado entre las líneas f1,l7,£3 . 


EJERCICIO 7.16 Suponiendo los dos ejercicios anteriores, demuestra que la construc- 
ción con dos líneas y una correspondencia proyectiva también es una superficie cuadrática. 


7.5.4 *Idea de la clasificación general 


Los métodos que hemos desarrollado se generalizan a todas las dimensiones y plantean 
naturalmente un programa para clasificar las “cuádricas”. Señalaremos brevemente 
los pasos principales de este programa. 

Se pueden considerar polinomios con n variables, X1,X>2,-** ,Xn, y a sus conjun- 
tos de ceros se les llama hipersuperficies algebraicas en IR”. Dentro de éstas, las 
definidas por polinomios de grado dos son las hipersuperficies cuadráticas, o simple- 
mente cuádricas. La pregunta general es cúales son las posibles cuádricas en IR”, y, de 
nuevo, hay que especificar un grupo de transformaciones para definir la equivalencia. 
El grupo natural a considerar es la generalización natural del afín a la dimensión 
correspondiente. 

Añadiendo una nueva variable xy, es fácil definir la homogeneización de tales 
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polinomios, y como sus ceros en R”*! son unión de líneas por el origen estos definen las 
hipersuperficies algebraicas proyectivas, y su clasificación módulo el correspondiente 
grupo proyectivo es más sencilla y natural (sobre los complejos y otros campos, son 
objeto de estudio de la geometría algebraica). En particular, las cuádricas proyectivas 
están definidas por polinomios homogéneos de grado dos, o formas cuadráticas, y para 
ellos se tiene la misma expresión matricial, usando matrices simétricas, que hemos 
estudiado. 

El punto clave vuelve a ser si las matrices simétricas se diagonalizan en una base 
ortonormal adecuada. Esto resulta ser cierto y es el teorema profundo o la parte 
técnica medular del programa, pues el resto de los lemas e ideas que usamos se gene- 
ralizan facilmente. Así que diagonalizando, cambiando escala, permutando variables y 
cambiando signo si es necesario, cualquier matriz es equivalente a una matriz diagonal 
con un bloque de 1 al principio, digamos que i de ellos, luego —si acaso— un bloque 
de —1, y finalmente —puede ser— un bloque de 0. 


1.0 0 
i 0 
1] 
—] 
n+1 
—1] 
0 
0 2 0 


Si tiene ceros se le llama degenerada, pues esencialmente viene de una dimensión 
anterior (el polinomio homogéneo se expresa, en la base adecuada, con menos de las 
n +1 variables). 

Las no degeneradas son las interesantes, y para éstas —como sólo nos interesan 
sus ceros— podemos suponer que hay a lo más tantos —1 como 1, es decir que 
i>(n+1)/2. Al número de —1, ¿.e. a (n+1— Ai), se le llama el índice de la forma 
cuadrática no degenerada. Las de índice O definen el conjunto vacío tanto proyectiva 
como afinmente. Las de índice 1, aunque son todas equivalentes proyectivamente, dan 
lugar a tres tipos de cuádricas afines: los elipsoides (cuyo representante canónico es la 
esfera de dimensión n), los paraboloides que son tangentes al hiperplano al infinito y 
los hiperboloides de dos hojas que son cortados, separados, por el hiperplano al infinito 
que, a su vez, las intersecta en una cuádrica de índice 1 en una dimensión menos. Y 
para cada índice (que llega hasta (n +1) /2 para n impar y hasta n/2 para n par) 
la correspondiente cuádrica proyectiva tiene tantas manifestaciones afines como haya 
tipos de hiperplanos respecto a ella, que son los que se pueden mandar al infinito. 
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Capítulo 8 


Geometría hiperbólica 


Como ya hemos mencionado, la geometría hiperbólica se desarrolló de manera abs- 
tracta en el estudio del Quinto Postulado, pues surge al negarlo pluralizando: son 
muchas las paralelas a una recta que pasan por un punto fuera de ella. Haciendo esta 
suposición, a principios del siglo XIX unos cuantos matemáticos como Lobachevsky 
y Bólyai sentaron sus fundamentos. Estaban convencidos de su solidez lógica, y por 
tanto de su “existencia o posibilidad”, pero estaban también en franca minoría. Se les 
tachaba de extravagancia o vil locura entre la comunidad científica. Se cuenta incluso 
que matemáticos de renombre, como el “Principe de las Matemáticas” Gauss, tenían 
resultados en geometría hiperbólica pero que no los hicieron públicos por temor al 
descrédito. Y no fue sino hasta que se descubrieron los modelos analíticos del plano 
hiperbólico cuando la comunidad matemática acabó por reconocerla. En la segunda 
mitad de ese siglo surgieron modelos del plano hiperbólico basados en la geometría 
euclidiana (en dimensión mayor). Fue entonces evidente su existencia; si la geometría 
euclidiana era consistente, también lo sería la hiperbólica. 


Nuestra presentación será analítica, y no axiomática, pero que quede este párrafo 
introductorio como homenaje a sus precursores que se dieron el lujo de tomarse la 
libertad de creer lo increíble, de crearlo y demostrarlo; sufrieron por ello, pero el 
tiempo les dio la razón. 


8.1 El plano hiperbólico 


Para definir la geometría hiperbólica (en dimensión 2), daremos muy fácilmente sus 
puntos (que forman el plano hiperbólico H2); sus subconjuntos distinguidos llamados 
líneas, y su grupo de transformaciones hiperbólicas. Lo que nos costará mucho más 
trabajo es demostrar que se merece el rimbombante nombre de “Geometría”, que es 
homogéneo (igual en todos lados y en todas las direcciones) y que tiene nociones de 
distancia y ángulo de tal manera que el grupo sea justo el de isometrías. 
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8.1.1 Puntos 


El plano hiperbólico, H?, consiste de los puntos interiores del círculo unitario, pero 
pensando IR? como la carta coordenada canónica del plano proyectivo P?, es decir, 


pu HR? := [o y) ER? |x?+y?<1) 
De pe flx:y:2] €P?|1x24+y?-z*<0). 


Obsérvese que el círculo unitario S!' no es parte de H?, pero 
que está ligado a él, es su frontera, y a veces nos referiremos 
a S! como “el círculo al infinito” del plano hiperbólico, y a 
sus puntos, como puntos al infinito, aunque, insistimos, los 
puntos al infinito del plano hiperbólico no son parte del plano 
hiperbólico (no hay que confundirse con el caso proyectivo). 

A esta manera de ver al plano hiperbólico se le conoce como 
el modelo proyectivo o modelo de Klein(hay otros modelos más que veremos adelante) 
y es importante pensarlo como subconjunto del plano proyectivo. Que además HH? 
haya quedado dentro de la carta canónica, R?, y justo dentro de su círculo unitario, es 
una simple convención para hacer más sencillos los cálculos, pero no es una condición 
esencial como veremos en el capítulo siguiente; pudimos haber tomado el interior de 
cualquier cónica. 


8.1.2 Líneas 


Las líneas, o rectas, del plano hiperbólico son sus intersecciones con líneas proyectivas 
(o euclidianas, da lo mismo, pues HH? está en una región acotada). Es decir, son 
segmentos abiertos cuyos extremos están en S' (son puntos al infinito 
hiperbólico), y corresponden a las cuerdas de S'. 

Es claro entonces que por cada par de puntos en H? hay una 
única línea que pasa por ellos: la intersección con la correspondiente 
proyectiva (y por tanto, que si dos líneas en el plano hiperbólico se 
intersectan, entonces se intersectan en un único punto). Pero además 
también es clarísimo que se cumple la negación plural del Quinto. Por 
un punto fuera de una línea pasan muchas líneas que no la intersectan; 
veremos que son “tantas como un segmento cerrado”. 

Para ser más precisos, se pueden distinguir dos tipos de no intersección. Se dice que 
dos líneas hiperbólicas que no se intersectan son paralelas 
si la intersección de sus correspondientes líneas proyectivas 
es un punto al infinito (hiperbólico), es decir, si está en A 
S!; y que son ultraparalelas si es un punto exterior. La 
otra posibilidad para dos líneas hiperbólicas es que sean 
concurrentes y se intersecten en H?. 
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Ahora sí, más precisamente, por un punto p fuera de una línea 

l pasan dos paralelas que parten las rectas por p en dos sectores (o 
segmentos), las concurrentes con l y las ultraparalelas con fl. 

Tenemos entonces tres tipos de haces de 

líneas en el plano hiperbólico: los concurrentes, 

los paralelos y los ultraparelelos, que consis- 

ten en tomar las rectas hiperbólicas de haces 


€ proyectivos concurrentes; lo que los distingue ci 
Y es en dónde queda el punto de concurrencia. 
] Vale la pena observar que en el plano proyectivo sólo hay 


._ un tipo de haz, el concurrente, y que en el plano euclidiano 
hay dos tipos, el concurrente y el paralelo. 


8.1.3 Transformaciones 


El grupo de transformaciones hiperbólicas consiste de todas las transformaciones 
proyectivas que dejan en su lugar al plano hiperbólico, y por lo tanto a su frontera, 


Hip (2): = [fe Pr(2)|f(H?) = 1?) 


= [fePr(2)1f(S) =8S'P; 


es, por así decirlo, el grupo de “simetrías proyectivas” del círculo unitario. 

Por el momento no es relevante que la igualdad de estos dos conjuntos esté bien 
demostrada —aunque lo argumentaremos intuitivamente a continuación—, pues usare- 
mos como caballito de batalla otra definición con un enfoque técnico más analítico. 
Lo importante por ahora es que las transformaciones hiperbólicas sean naturales y 
fáciles de definir. Son lo que las transformaciones proyectivas, que en principio ya 
conocemos, le hacen al plano hiperbólico. 

Que da lo mismo fijar el círculo unitario que su interior (la igualdad previa de 
conjuntos), es consecuencia de que S' parte el plano proyectivo, P?, en dos pedazos 
topo Ppamento distintos: el interior que es un disco abierto (y que hemos llamado 
1H), y el exterior que es una banda de Moebius abierta cuya ánima o corazón es la 
recta al infinito. Basta entonces pedir a una transformación proyectiva que mande 
al círculo unitario en sí mismo, pues entonces tiene que mandar al interior, H?, en sí 
mismo y también al exterior en sí mismo; no los puede intercambiar.' 


Ejemplos de transformaciones hiperbólicas son las rotaciones en el origen, pues 
mandan a H? en él mismo. Pero podemos decir aún más, que 


O (2) C Hip(2), 


l Afirmaciones como ésta, que el disco es diferente de la banda de Moebius, aunque intuitivamente 
claras, sólo se pueden demostrar usando topología algebraica que se desarrolló en el siglo XX. 
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pues también las reflexiones en rectas por el origen dejan en su lugar al círculo unitario 
S' (y a su interior H?). Demostraremos más adelante que las únicas transformaciones 
hiperbólicas que dejan fijo el origen son éstas, es decir que 


O (2) =(f € Hip (2) | 1 (0) =0). (8.1) 


Nótese que ésta es la misma propiedad que cumple el plano euclidiano E?: O (2) 
es el subgrupo de las isometrías que dejan fijo el origen. Y también es lo que cumplen 
el plano esférico (proyectivo rígido) o S?: las isometrías que dejan fijo un punto son 
rotaciones en él y reflexiones en una recta por él. Así que las tres geometrías son 
iguales local o infinitesimalmente. 

La gran diferencia de enfoque es que en las geometrías anteriores (euclidiana y 
esférica) teníamos la métrica (nociones de distancia y ángulo) y de ahí dedujimos el 
grupo; ahora tenemos el grupo y queremos deducir que hay nociones de distancia y 
ángulo que lo hacen ser el grupo de isometrías. 

Cuando logremos demostrar (8.1) y además que hay transformaciones hiperbóli- 
cas que mueven el origen (y por tanto que éste es un punto como cualquier otro), 

tendremos que H? se comporta como las otras geometrías; que una trans- 

formación está determinada por lo que le hace a un punto, a una línea 

orientada por él y a uno de los lados que ésta define (si preserva o no 

orientación); una vez determinados estos valores, la métrica, o rigidez 

| del plano, obliga al resto de la transformación (obsérvese que si el punto 

LY se queda fijo, los otros dos datos parametrizan O (2)). La homogeneidad 

consiste en que todas estas ternas son equivalentes, “que se ve igual desde 

cualquier punto y en cualquier dirección”. Primero estableceremos que éste es el caso 

de las transformaciones hiperbólicas, y entonces veremos que las nociones de distan- 

cia y ángulo están obligadas por el grupo de transformaciones. Pero para lograrlo 
necesitaremos más herramientas. 


8.2 El espacio de Lorentz-Minkowski 


12 


Hemos definido al plano hiperbólico, H?, como el interior del círculo unitario, S'. Este 
último (en IR?) está determinado por el polinomio x?+y?*—1, y al considerarlo dentro 
del plano proyectivo, 1P?, su forma cuadrática asociada es el polinomio homogéneo en 
tres variables: 


2 2 2 
Xx +y —=Z, 


que hemos llamado la forma cuadrática de Lorentz. Su matriz simétrica asociada es 
la matriz de Lorentz 

10: 0 

L:s=1|01 0 ; 

0.0 -—1 
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y entonces podemos escribir 


10 0 Xx 
*+y—z2=(xyuyz3| 0.1 0 y | =x'Lx. (8.2) 
0 0 —1 Z 


Una observación muy simple sobre esta última expresión (x'Lx) nos brindará 
nuestra herramienta técnica fundamental. La observación es que el vector variable 
x € R* aparece en dos lugares aislados de la expresión, y por tanto se puede extender 
a una expresión con dos variables vectoriales. 

Para x y y en R*, definimos su producto interno de Minkowski como el número 
real 


xeL y := x' Ly (8.3) 
= x- (Ly) = (Lx) - y. 


Recordemos que tanto en la geometría euclidiana (capítulo ??) como en la esférica 
(capítulo ??), las nociones métricas básicas de distancia y ángulo se definieron usando 
como herramienta el producto interior. Lo que el producto interior es a la forma 
cuadrática euclidiana (x? +y? +2?) —algo más general que, en particular, la define— 
, lo será ahora el producto interno de Minkowski respecto a la forma cuadrática de 
Lorentz (8.2); y de manera análoga a como se usó el producto interior euclidiano 
en las otras geometrías, el de Minkowski será fundamental para definir las nociones 
geométricas básicas en el plano hiperbólico y entender sus transformaciones. 

En coordenadas, si x = (x1,x2,x3)' y y = (y¡,y2,y3) ., el producto interno de 
Minkowski toma la expresión 


10.0 
xeLy = (x1,x2,x3)| 0 1 0 Ya 
00 -—1 Y3 


= X1Y1 + X2Y2 — X3Yz3 , 


y es una función de R* x ¡R3 en R, que claramente cumple (ver siguiente ejercicio): 


xe.Y = Ye x (es simétrica), (8.4) 
(ax+fBy)erz = alxe z)+f(y er 2) (es lineal). 


La segunda propiedad es que la función es lineal en la primera variable al fijar la 
segunda. Junto con la simetría, implica que así mismo es lineal en la segunda variable 
y entonces se dice que es bilineal. Entonces también se le llama la forma bilineal de 
Minkowski o de Lorentz o de Lorentz-Minkowski; en breve, comentaremos sobre el 
porqué de estos personajes asociados. 


EJERCICIO 8.1 Demuestra las ecuaciones (8.4) para cualquier x,y,z €ERÍ y a,B ER. 
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8.2.1 L-norma 


Así como la norma (euclidiana, vamos a especificar) se obtiene del producto interior, 
podemos pensar la forma cuadrática de Lorentz como una “norma”. De la fórmula 
clásica lx]? = X-x, vamos a piratear la notación para la norma de Lorentz-Minkowsk:, 
o L-norma, de un vector x € R3: 


xl? :=x e x=x'Lx 


(que en coordenadas se escribe x?+y?*—z2? (8.2)), donde hay que pensar el “cuadrado”, 
¿.e., el exponente 2, simplemente como notación. Pero notación afortunada pues 
claramente se cumple que 
exi; =+? (xi, 

de tal manera que, como ya lo habíamos remarcado para cualquier forma cuadrática, 
el signo se preserva en las rectas por el origen. 

La gran diferencia con el caso clásico es que ahora tenemos vectores de norma 
negativa o cero. Démosles nombres: 


il Un vector x € RY 


dk o su recta  [x] 


espacial, si xl? 0% 
es temporal, si bel 03 
luz, si Ixlé =l., 


Geométricamente, los vectores luz forman el cono so- 
bre S' (en el plano z = 1); los temporales están dentro 
del cono, y los espaciales fuera de él. Así, por ejemplo, los 
vectores canónicos e; y e, son espaciales, como cualquier 
otro vector en el plano xy; mientras que el eje z es tem- 

poral y las líneas luz son las que tienen un ángulo de 45” respecto al plano xy (y con 
el eje 2). 


Nota histórica 


La nomenclatura que estamos usando viene de la Teoría de la Relatividad Especial 
que se desarrolló a principios del siglo XX. Albert Einstein es el personaje principal 
con quien se asocia su concepción, pero muchos otros científicos contribuyeron. Entre 
estos destacan como precursores el físico holandés Hendrik A. Lorentz y el matemático 
francés Henri Poincaré. Unos años despues del famoso trabajo de Einstein de 1905, el 
matemático alemán Hermann Minkowski reformuló en términos geométricos la Teoría 
de la Relatividad Especial.? Puesto que nuestra motivación y línea de razonamiento 
no es la que originalmente tenían ellos, es difícil establecer aquí con precisión qué es lo 
que históricamente se debe a cada cuál. Nuestra asociación de nombres (Lorentz y/o 


2Un buen recuento de esta historia puede verse en [1]. 
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Minkowski) a los objetos matemáticos que han aparecido no debe entonces tomarse en 
forma muy literal; más bien es un homenaje y un intento de apegarse a la terminología 
usada en la literatura (que no es única). Sin embargo, vale la pena tratar de precisar 
algo sobre el uso de los términos “espacial”, “temporal” y “luz” (o quizá debía ser 
“lumínica” ). 

El problema físico básico que da lugar a la Relatividad Especial tiene que ver con 
cómo se relacionan distintos sistemas de referencia. Para distintos observadores, un 
mismo evento o sucesión de eventos físicos pueden parecer diferentes; pero debería 
haber una “realidad física única”. Se resuelve el dilema incluyendo el parámetro 
“tiempo” dentro de un continuo espacio-tiempo que permita hacer mediciones a ob- 
servadores con respecto a “sus” coordenadas de tiempo y espacio, abandonando la 
idea de que éstas son absolutas: se relativizan. En nuestro caso (R* con el producto 
interno de Minkowski), las dos primeras coordenadas, x y y, son las coordenadas 
espaciales y la tercera, z, es la coordenada temporal (en los textos con motivación 
estrictamente física se usaría una t en vez de nuestra z). Es un modelo de un universo 
de dos dimensiones espaciales (uno más parecido al que habitamos usaría una tercera 
coordenada espacial, z digamos, y una cuarta, ahora sí t, considerando entonces la 
forma cuadrática x? +y?+2?—t? ). A un punto en él se le llama un evento (un lugar 
en el espacio en un tiempo dado), y una partícula, o un observador, es una curva 
continua estrictamente ascendente, una curva de vida, digamos. 


Parece una contradicción pues estamos dando coordenadas absolutas, pero sólo 
lo son para el evento Ó, en el origen, y suponerlo como observador estacionario es 
determinar que su curva de vida es el eje z. Un observador inercial (en movimiento 
inercial uniforme) que coincida con el evento O es justo una recta por el origen. Que 
nada, excepto los fotones, pueda viajar a la velocidad de la luz (normalizada para que 
sea 1), significa que las líneas que hemos llamado luz (las del cono) son las trayectorias 
de los fotones que emanan de O y que las posibles líneas de vida inerciales del evento 
O son lo que hemos llamado líneas temporales (dentro del cono). Un evento espacial 
es, entonces, un evento sin relación posible con el O, pero para un evento temporal 
hay la posibilidad de comunicación (por mensajes de luz, digamos). 


Hasta aquí, y así de vago, medio se explican los términos o vocablos que estamos 
usando. Lo maravilloso es que las mismas herramientas matemáticas, y por tanto 
terminologías muy similares, sirvan para explicar y estudiar fenómenos aparentemente 
tan lejanos. Por un lado, que la velocidad de la luz es una constante irrebasable (el 
famoso experimento de Michelson y Morley) y su devenir en la Teoría Especial de 
la Relatividad, y por el otro la existencia de la geometría hiperbólica. En ambas, el 
producto interno de Minkowski es importante; por ejemplo, la noción de ortogonalidad 
que se desprende de él da, por un lado, el plano de simultaneidad para un observador 
inercial y para nosotros dará el concepto fundamental de polaridad.* 


3Para un enfoque más físico de la geometría en el espacio de Minkowski ver [16] y [17]. 
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8.2.2 L-ortogonalidad y polaridad 


Lo primero que surge naturalmente del producto interior, o que por ahí se va con 
la norma, es la noción euclidiana de ortogonalidad. De igual manera, de la forma 
bilineal de Lorentz-Minkowski podemos sacar un análogo que tendrá un importante 
significado geométrico. 

Dos vectores v y u en R* son L-ortogonales si 


ve, u=0. 


Y podemos definir el plano L-ortogonal a v € R3, v % 0, como 


Wiv := fx € Ro | ve x=0). 


Veamos que nuestra definición de “plano L-ortogonal” es efectivamente un plano 
en R?, es decir, que estamos usando el vocablo “plano” de manera adecuada. Puesto 
que L como matriz es no singular -de hecho L7' = L pues L como transformación 

lineal es la reflexión en el plano xy-, se tiene que 


vA0 5 LlvZ0. 


L A d 
j Entonces, como ve¡ x = (Lv) -x, donde “ - ” sigue siendo el pro- 


ducto interior euclidiano, tenemos que TT, es el plano (euclidi- 
anamente) ortogonal a Lv que es, efectivamente, un plano pues 
Lv HF 0. De esta demostración podemos extraer, además del lema 
que viene, que si v gira de la vertical hacia el plano horizontal 
xy, su plano L-ortogonal gira del horizontal al vertical pero en sentido contrario, pues 
es el euclidianamente ortogonal a su reflejado en el plano xy. 


Lema 8.1 Cualquier plano por el origen en R* es el plano L-ortogonal de algún 
vER?,vX%0. Además, Mi, = Ti. si y sólo si [v] = [ul. 


Demostración. Sabemos que cualquier plano por el origen TI es euclidianamente 
ortogonal a algún w € R?. Sea vw = Lv = Lv”, entonces TT = Th». Además, 
Mi = Miu si y sólo si [Lv] = [Lu] y, como L es no singular, esto sucede si y sólo si 
[v] = [ul]. O 


Con este lema, podemos regresar al plano proyectivo, P?, pues para un punto 
p = lv] en él, tenemos definida una línea (la correspondiente al plano TT¡,) que 
llamaremos la línea polar de p, y denotaremos p” (léase “p-polar” ); es decir, 


15 = lu =( ld EP? [ve x=0), 


que, como veremos a continuación, es la línea polar respecto al círculo unitario que 
habíamos definido en el capítulo 2 y que entonces habíamos denotado €, . Pero además, 
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el lema implica que para cualquier línea proyectiva l existe un punto bien definido, 
que llamaremos su punto polar, denotado £*, del cual l es su línea polar ((0-)- =: 
Veamos cómo es esta correspondencia en términos geométricos 

Si tomamos un punto p = (a,b) e R? C 1P?, entonces su vector asociado en R* 
es v = (a,b,1), cuya línea polar, por definición, tiene como polinomio homogéneo 
asociado a 


10.0 Xx 
ve,x=(ajb 1)| 0 1 0 y | =ax+by-z. 
0.0 —1 z 


Que nos da, de regreso en ¡R?, haciendo z = 1, que la línea polar de p = (a,b) es 


p?: ax+by=1 


que, para (a,b) 4 (0,0), es la línea ortogonal al vector p A 
(a, b) y cuya distancia al origen es el inverso de la norma 
de (a,b); por ejemplo, para el punto (a,0) es la recta 
x= 1/a. Tenemos entonces tres casos: si p € HP (si p es 


temporal, podríamos decir) entonces p” es una línea afuera 
del círculo unitario (es una línea espacial); si p € S' (es 
luz) entonces su polar p* es la tangente a S' en él (y se 
tiene que p € p* pues a? + b? =1), y si p es espacial (es 
exterior al círculo) entonces p+ es una línea hiperbólica 
(pasa por 1H). 

En el párrafo anterior (que corresponde a lo hecho en el capítulo 2) nos faltaron 
ciertos casos proyectivos que analizar. Primero, la línea polar del origen (el centro del 
círculo, (0, 0)) es precisamente la línea al infinito, definida por el polinomio homogé- 
neo —Z. Y por último, para los puntos al infinito, con vector asociado (a, b,0), se 
tiene que sus líneas polares son las líneas por el origen perpendiculares a la dirección 
correspondiente, con ecuación ax + by = 0. 

Tenemos entonces, y en correspondencia al lema anterior, que la polaridad es una 
biyección entre puntos y líneas proyectivas. Además cumple el principio de dualidad: 


peda” 6 qep', (8.5) 


pues si p = [v] y q = lul, ambas condiciones son, por definición, que ve; u = 0; y en 
este caso podemos decir entonces que los puntos p y q son (L-) ortogonales. Y más 
aún, podemos definir que dos rectas n y € (usaremos las letras griegas n “eta”, E “xi” 
y € “dseta” para designar líneas proyectivas) son ortogonales si sus puntos polares 
lo son, es decir, si n* € E (que es equivalente a ¿+ € n). El caso más importante 
es cuando n y € son líneas hiperbólicas concurrentes, i.e., cuando n N € € H?, pues 
que sean ortogonales va a querer decir que su ángulo hiperbólico es de 90%; ya es una 
noción métrica. 
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Hemos definido la polaridad de manera algebraica, pero tiene un fuerte contenido 
geométrico puesto que la línea polar de un punto en S! es su línea tangente y se cumple 
el principio de dualidad (8.5). Así, si 1 es una línea hiperbólica y 
q1 y 42 son sus puntos al infinito, es decir, si (q1,q,) =n NS', 
entonces la intersección de las tangentes a S' en q1 y q) es el punto 
polar de n, es decir, 


1 =41 Maz. 


Pues si declaramos p = q+ M q+ entonces q; € p* y q2 € p+ 
por (8.5), entonces p” tiene que ser la recta por q1 y q2 que es n, y por tanto 
q = (p-)" = p. E inversamente, tenemos que si p es un punto espacial, su polar es 
la línea hiperbólica que pasa por sus pies en S', es decir, los dos puntos en S! cuyas 
tangentes pasan por p. 


EJERCICIO 8.2 Calcula los pies del punto (2,0) en el círculo unitario encontrando la 
ecuación de su línea polar y sus intersecciones con S?. ¿Puedes dar una fórmula para los 
pies del punto (a,b) (con a? + b? > 1, por supuesto)? 

EJERCICIO 8.3 ¿Cómo construyes con regla y compás la línea polar de un punto 
hiperbólico? (Supón que el compás te sirve para trazar tangentes a un círculo.) 


EJERCICIO 8.4 Demuestra que dos rectas hiperbólicas son concurrentes (se intersectan 
dentro de H?) si y sólo si la recta que pasa por sus polares es espacial. 


EJERCICIO 8.5 Demuestra que las líneas polares de puntos colineales son concurrentes. 


EJERCICIO 8.6 Demuestra que, dado un punto p € H? y una recta hiperbólica n, 
existe una única recta hiperbólica € ortogonal a n y que pasa por p. (Primero olvídate de 
las condiciones sobre dónde están los puntos y las líneas.) 


EJERCICIO 8.7 En H?, demuestra que dos rectas ultraparalelas tienen una única recta 
ortogonal común. 


EJERCICIO 8.8 Demuestra que los haces ultraparalelos están formados por todas las 
ortogonales a una recta dada. 


EJERCICIO 8.9 ¿Cuáles son las rectas ortogonales a una recta luz, es decir, polar de 
un punto luz? 


8.2.3 Ternas ortogonales 


Tres puntos a,b,c en P? forman una terna ortogonal si dos a dos son ortogonales. 
Como ejemplo obvio, tenemos la terna canónica, [e,], [ez], [ez] pues e; e, e; =0 para 
i%43. Obsérvese que si bien el producto interior de Minkowski no está bien definido 
(ni en signo) para puntos en P?, pues (tu) e, (sv) = (ts) (u e, v), y entonces depende 
de los representantes; la L-ortogonalidad sí lo está, pues si este producto es O para 
algún par de representantes, lo es para cualquiera. 
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Veremos ahora que existen muchas ternas ortogonales; tantas como líneas con un 
punto distinguido en el plano hiperbólico. Consideremos cualquier punto e € H?; 
empezamos con el tercer punto por analogía con la terna canónica donde [ez] es el 
punto hiperbólico. Tomemos ahora cualquier punto b € c+ (o, lo que es lo mismo, 
cualquier recta hiperbólica b* que pase por c). Y ahora sí, a 
queda determinado por 


a=b" m0 (8.6) 


Está bien definido pues b+ % c* ya que la primera recta es 
hiperbólica (contiene a c pues c € b*) y la segunda espacial, y 
además, por definición, a es ortogonal a b y a c. 

Nótese que en una terna ortogonal, el punto polar a la línea 
por dos de ellos es el tercero; pues, e.g., b € a* y e € a? implican 
que (bc) = a*, que es la ecuación dual de (8.6). 

No es casualidad que en el ejemplo nos hayan salido dos puntos espaciales y uno 
temporal. 


Lema 8.2 Sea a,b,c una terna ortogonal; entonces dos de los puntos son espaciales 
y uno es temporal. 


Demostración. Observemos primero que si uno de los puntos es hiperbólico en- 
tonces, como su línea polar es espacial y en ella están los otros dos puntos, el lema se 
cumple; la construcción es como arriba. 
Supongamos que alguno de los puntos, digamos a, es es- 
pacial. Pongamos las rectas por a en biyección natural ——por 
intersección — con los puntos de su línea polar a+. Los dos pies 
de a parten los puntos de a+ en dos segmentos abiertos: puntos 
(y correspondientemente, líneas por a) hiperbólicos, y puntos (y 
líneas por a) espaciales. Sabemos que b está en a y que 


n= amb 3 


Si b es espacial, entonces la línea b* es hiperbólica y por tanto 

también lo es c. Si b es luz (b € b*), entonces e = a+ Nb* = b y no tendríamos 
una terna. Nótese que esto implica que no hay puntos luz en la terna pues todos sus 
ortogonales (y distintos) son espaciales. Y hemos terminado. O 


Podemos convenir entonces que una terna ortogonal a, b, c está ordenada y tiene 
como punto temporal al tercero, c. Y concluir que las ternas ortogonales están 
en biyección natural con las parejas incidentes punto-recta en el plano hiper- 
bólico H?, pues una terna se define al escoger un punto c € H? junto con una recta 
b* que pasa por él; ya que entonces a” es la única ortogonal a b” por c (ver Ejercicio 
8.6), o bien se tiene que a =b+ Nc”. 
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EJERCICIO 8.10 Describe todas las ternas ortogonales que tienen el origen como punto 
temporal. 


EJERCICIO 8.11 Encuentra una terna ortogonal que tenga al punto c = [1 : 1: 2] como 
punto temporal; haz un dibujo. 


EJERCICIO 8.12 Describe geométricamente cómo construir con regla y compás la terna 
ortogonal que corresponde a un punto en el disco unitario y un segmento que pasa por él 
(el compás lo necesitas para trazar ortogonales euclidianas). 


EJERCICIO 8.13 Sean a y b dos puntos espaciales. Demuestra que las líneas hiper- 
bólicas a+ y b* son concurrentes, paralelas o ultraparalelas correspondientemente a que la 
línea proyectiva por a y b, (ab), es espacial, lumínica (tangente a S!) o hiperbólica. 


8.3 El grupo de transformaciones 


Teniendo ya una multitud de ternas ortogonales en el plano proyectivo P?, las subire- 
mos a R? para construir ternas L-ortonormales y a partir de ellas entenderemos el 
grupo de transformaciones hiperbólicas. La analogía que hay que mantener en mente 
es que las matrices ortogonales (en el sentido euclidiano clásico) tienen como columnas 
a vectores que forman una base ortonormal y son justo las que preservan el producto 
interior. 


8.3.1 Vectores L-unitarios y la cazuela hiperbólica 


Decimos que un vector x € R* es L-unitario si su L-norma 
es 10 —1, es decir, si en valor absoluto 


[bg] =1. 


Tenemos entonces dos tipos de vectores unitarios: los 
temporales que forman un hiperboloide de dos hojas (el 
E lar dado por la ecuación x? + y? — z? = —1), y los espaciales 
que forman un hiperboloide reglado de una hoja (dado por 
x? + y? — z? = 1). Esto se ve pues se obtienen, respectiva- 
mente, rotando en el eje z a las hipérbolas y? — z? =-—1 y 
y? — 2? =1 que viven en el plano yz. 


El cono de luz es el cono asintótico de ambos hiperboloides; por dentro se le unta 
el temporal de dos hojas y por fuera el espacial. 
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Notemos que el plano hiperbólico está en biyección nat.- 
ural con la hoja superior de los L-unitarios temporales, a la 
que llamaremos la cazuela hiperbólica. Pues si pensamos a AS 
IE? dentro del plano z = 1, en la carta coordenada canónica N 


como habíamos quedado, la línea por el origen correspon- 
diente a un punto en IHÉ es temporal e intersecta a am- 


bas hojas de los vectores temporales unitarios, entonces le ES 
podemos asignar el punto que está en la cazuela hiperbólica h 
y que tiene su tercera coordenada positiva. E inversamente, 

un punto en la cazuela hiperbólica representa un punto en el proyectivo que está en 
IE. Geometricamente es la proyección desde el origen. 


A este modelo del plano hiperbólico (la cazuela) se le conoce a veces como “la 
esfera de radio imaginario” , pues son soluciones para la ecuación li = —1; pero 
nosotros le seguiremos llamando “la cazuela”. Representa algo más realista respecto 
a la geometría hiperbólica en cuanto a distancias y ángulos se refiere, que el modelo 
proyectivo (HI? como subconjunto de PP?) que hemos venido usando; pues, por lo 
menos, el infinito ya se ve bien lejos: no dan ganas de pegárselo. Además, las rectas 
hiperbólicas se ven en la cazuela como intersecciones con planos por el origen, que 
son una rama de una hipérbola. 


Nuestros dos modelos de H? seguirán siendo compatibles, pues la manera en que 
definiremos el grupo de transformaciones, a continuación, dejará fija, y actuará, tam- 
bién en la cazuela hiperbólica. Para no excedernos en notación, introduciendo un 
nuevo símbolo, abusaremos de ella denotando a la cazuela hiperbólica también 
con H?; el contexto nos dirá si nos referimos al modelo proyectivo (por ejemplo, si 
los DUROS en H? considerados son proyectivos), o bien si es la cazuela, cuando sus 
elementos son vectores en R?. 


8.3.2 Bases L-ortonormales 


Una terna ordenada de vectores u, v, w en R* es una base L-ortonormal si los tres 
vectores son L-unitarios y dos a dos son L-ortogonales. Es claro que entonces la terna 
[u], [v], [w] en P? es ortogonal, y por el Lema 8.2 uno de los vectores es temporal 
y los otros dos son espaciales. Supondremos siempre que el tercer vector, w, es el 
que es temporal. A la matriz B = (u, v, w) la llamaremos L- ortogonal, de tal manera 
que ternas L-ortonormales y matrices L-ortogonales se corresponden. (Como las bases 
ortonormales euclidianas y las matrices ortogonales.) 


Obsérvese que la base canónica e;, ez, ez es L-ortonormal (y la matriz identidad 
T es L-ortogonal). 

La maravilla que cumplen las matrices L-ortogonales, como en el caso de las matri- 
ces ortogonales respecto al producto interior, es que al pensarlas como transformación 
lineal, dejan invariante la forma bilineal de Lorentz. 
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Teorema 8.3 Sea B una matriz de 3 x 3; entonces son equivalentes: 


¿) B es L-ortogonal; 
1i) xe y =(Bx) e, (By) Vx,y ER*; 
dio) BTLB=L. 


Demostración. Casi por n-ésima vez pero ahora con dos variables, hagamos el 
cálculo de 


(Bx) en (By) = (Bx)' L(By) = (x"B") (LB) y =x' (B'LB) y. 


Es claro entonces que (iii) > (1). 
Expresemos la matriz B' LB en términos de las columnas de B = (u, v, w), 


B'LB = B'L(uv,w) =B' (Lu, Lv, Lw) 
yr 

v! (Lu, Lv, Lw) 

w! 

u'Lu u'llv u'lw 


vilu v'lv v'lw 
w!'lu w'lv w'lw 


ue u ue v ue w 
= vVveju veí¡v ve, w 
We¡u we¡v we w 


Nótese que las seis condiciones para que U, V, W sean una base L-ortonormal (tres de 
normalidad y tres de ortogonalidad) son precisamente que las entradas de esta matriz 
simétrica sean justo las de la matriz de Lorentz, L (donde es importante nuestra 
convención de que w sea el temporal). Así que (iii) S (1). 

(11) > (111). Puesto que u = Be,, v= Be, y w= Be, entonces si se cumple (ii) 
se tiene que esta última matriz es L, pues la base canónica es L-ortonormal. Ol 


Más que por su demostración, que es muy simple, este teorema es tal por su fuerza. 
Nos da un subgrupo de GL (3) asociado a la forma bilineal de Lorentz (ver Ejercicio 
8.14), que se denota O (2, 1) pues se dice que la forma bilineal de Lorentz tiene índice 
2,1 (por el número de “más” y “menos”). Generalizan estos grupos a los grupos 
ortogonales. Al preservar la forma bilineal de Lorentz, estas matrices preservan los 
“estratos” de su forma cuadrática. En particular manda vectores luz en vectores luz, 
temporales en temporales y a los espaciales en ellos mismos. Pero aún más, preservan 
las superficies de nivel, definidas por xi = cte. Nuestro interes está en el subgrupo 
de las que preservan la cazuela hiperbólica, y esto es fácil de detectar pues la tercera 
columna, como vector, debe apuntar hacia arriba. 
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Sea 
H(2):=(B € GL(3)|B'LB=L; Bez - ez >0). 


Estas matrices son las L-ortogonales que tienen su vector temporal unitario precisa- 
mente en la cazuela H?; las llamaremos matrices hiperbólicas. Forman un grupo 
(Ejercicio 8.15) de transformaciones lineales de R% que mandan a H? en sí mismo 
pues para B € H (2) 


x e H? > bx? =-—1 => ¡Bx]? = Bx e, Bx =x e x =|xl? =-1; 
L L L 


y además Bx tiene tercera coordenada positiva como Bez, pues el segmento de x a 
ez es mandado al segmento de Bx a Bez y en éste la forma cuadrática de Lorentz es 
estrictamente negativa y por lo tanto no cruza el cono de luz. 

Veremos que este grupo H (2) de matrices hiperbólicas se identifica naturalmente 
con el grupo Hip (2) de transformaciones hiperbólicas que definimos geométricamente 
en 8.1.3 (las transformaciones proyectivas que preservan el círulo unitario). Como una 
matriz en GL (3) define una transformación proyectiva, tenemos una función natural 
H (2) —> Hip (2), pues, como ya hemos dicho, las matrices L-ortogonales mandan 
al cono de luz (S') y al conjunto de las líneas temporales (H?) en sí mismos. Esta 
función es una inclusión (inyectiva) pues dos matrices definen la misma transformación 
proyectiva sólo cuando son múltiplos; si dos matrices distintas L-ortogonales fueran 
múltiplos, la constante que las relaciona tendría que ser —1 pues sus vectores son 
L-unitarios, y entonces sólo una está en H (2), la que tiene entrada 3,3 positiva. Así 
que (podemos pensar que) 


H (2) C Hip(2). (8.7) 


Antes de entrar de lleno a la prueba de la igualdad conviene ver algunas de las 
propiedades de las matrices hiperbólicas y algunos ejemplos. 


EJERCICIO 8.14 Demuestra que para cualquier matriz A € GL (3) se tiene que Ga := 
(B |BTAB = A) es un subgrupo de GL(3); obsérvese que también hay que demostrar que los 
elementos de Ga son matrices invertibles. ¿Cuánto vale el determinante de estas matrices? 
EJERCICIO 8.15 Demuestra que H (2) es un grupo. 


EJERCICIO 8.16 Dada una matriz 


oa Az A 
B=| B1 f2z 83 |. 
Y Y2 Y3 
demuestra que B' LB =L si y sólo si 
] oa. Br —v 
B"=| % Bb —v 


08 =P. Ye 


1...Dibujos 
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EJERCICIO 8.17 Exhibe una transformación hiperbólica que mande al punto 
[1/2,1/2,1] en el origen. (Usa el Ejercicio 8.11 y el anterior.) 


8.3.3 Homogeneidad e isotropía 


Veremos que todos los puntos de H? son iguales (equivalentes según el grupo) — 
propiedad conocida como homogeneidad— y que, al fijar un punto, también son 
equivalentes todas las direcciones por él —isotropía—. 

Consideremos una terna ortogonal a,b,c en P?. La podemos levantar a una 
base L-ortonormal como sigue. Á c le corresponde un único vector w en la cazuela 
hiperbólica. A b (y respectivamente a a) le corresponde una recta por el origen 
en IR3 que, por ser espacial (“acostadita”), intersecta al hiperboloide de L-unitarios 
espaciales justamente en dos puntos. A saber, si b = [b] estos son 


(15) > 


que tiene sentido pues 15 > 0. Llamemos v a cualquiera de ellos de tal manera que 
nuestras dos opciones son +v. Y, respectivamente, sea u € ¡R3 tal que huj = ly 
a = lu]. Tenemos entonces que las cuatro matrices 


(+u, +v, w) 


están en H (2) y mandan a la terna canónica [e], [ez], lez] en la terna ortogonal 
a, b,c con que empezamos. 

Consideremos el ejemplo más sencillo que es la terna canónica. Si tenemos que 
(a,b,c) = (le¡],le>],[ez]), las cuatro matrices a las que llegamos en el párrafo 
anterior son 


+1.00 
0 +1 0 
0 0 1 


que, efectivamente, dejan fijo al origen y a cada uno de los dos ejes (estamos pensando 
en la carta canónica, por supuesto), pero permutan los cuatro cuadrantes, les cambian 
orientación a los ejes. Forman además un grupito (el diédrico 
de orden dos, D,). Escoger entonces a alguna de las cuatro 
matrices tiene que ver con cómo se orientan las rectas b y 
a+. Veámoslo. 

El vector v (seguimos pensando en el de arriba) no sólo 
define a la recta proyectiva lv]? = b- sino también al plano en 
IR? que habíamos denotado con TT; , (: ve, x = 0), pero además 
le escoge un lado: en el que él está (bien definido, pues v £ Tl,,, 
por ser espacial). De tal manera que la otra opción, —v, escoge 
el lado opuesto de TT; y. 
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Definamos entonces una línea hiperbólica orientada como una línea 
hiperbólica junto con uno de sus dos lados en H? distinguido. Y ahora sí, 
a una línea hiperbólica orientada podemos asociarle de manera continua 
y única un vector unitario espacial: el que está del mismo lado de su cor- 
respondiente plano por el origen que el lado distinguido de la recta (pen- 
sando que H? está en la carta coordenada canónica contenida en R?). 

Dos observaciones son pertinentes antes de seguir adelante. Primera, 
que nuestra nueva definición de orientación para rectas es equivalente a 
la —quizá más natural por ser intrínseca— de distinguir una dirección preferida de 
circulación para sus puntos. La equivalencia depende de adoptar una convención. La 
regla de la autopista, que —con perdón de los ingleses — reza: “siempre se rebasa por 
la izquierda”. Así, si dos puntos viajan por una recta en su dirección intrínseca distin- 

guida pero el que va atrás va más rápido, puede rebasar al lento por la 
izquierda distinguiendo entonces un lado; e inversamente, con un lado 
y distinguido hay sólo una dirección intrínseca que lo usa para rebases 


civilizados. Sin embargo, esto no funciona para el plano proyectivo 

donde una recta no corta en dos “lados” pero sí se puede orientar 
intrínsecamente (el segundo rebase sería por el lado contrario), poniendo en duda 
nuestra nueva definición que involucra rectas proyectivas. Ésta es la segunda obser- 
vación, junto que no hay problema. Pues sólo estamos hablando de líneas hiperbólicas 
que sí cortan al disco H? en dos pedazos. 

Por ejemplo, el eje de las x (le217) con su orientación positiva tiene como vec- 
tor asociado a ez; y e tiene como recta hiperbólica orientada al lado derecho del 
eje y, dándole orientación intrínseca hacia abajo, ¡la negativa! Pero queda bien, 
pues si intersectamos los dos lados distinguidos, obtenemos el primer cuadrante. En 
general, a una base L-ortogonal u,v, w le podemos 
asociar un cuadrante hiperbólico: la intersección de 
los lados distinguidos de las dos rectas hiperbólicas 
ortogonales orientadas que determinan u y v; su es- 
quina es [(w]. (Obsérvese que es la imagen del primer 
cuadrante bajo la matriz L-ortonormal B = (u, v, w).) 

Así que un cuadrante hiperbólico es una terna ortogo- 

nal con la información adicional de uno de sus cuatro 

cuadrantes distinguido; y la base canónica tiene asociado el primer cuadrante. Hemos 
demostrado, junto con el consabido argumento de “contagio grupal” —eso de que con 
una que vaya a todas entonces ya todas van contra todas—, el siguiente teorema. 


Teorema 8.4 Las matrices hiperbólicas, H (2), están en correspondencia biyectiva 
natural —asociándoles su imagen del primer cuadrante— con los cuadrantes hiper- 
bólicos. En particular, dados dos cuadrantes hiperbólicos existe una única transfor- 
mación hiperbólica que manda a uno en el otro. Ol 


Formalmente, nos adelantamos al usar indistintamente los términos matriz y trans- 
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formación en las dos frases del teorema. Pero ya estamos en posición de concluir con 
soltura su equivalencia. 


Proposicion 8.5 Hip (2) =H (2). Es decir, cualquier transformación g € Pr(2) que 
preserva el círculo (tal que g (Ss) =S!) está determinada por una matriz B € H (2). 


Demostración. Ya vimos que H (2) € Hip (2) en (8.7), demostremos ahora la 
orta contención. Consideremos la terna ortogonal canónica le], [e2], lez]; añadá- 
mosle las líneas hiperbólicas [e,]+ y [e>]? así como las cuatro tangentes (i.e., líneas 
polares) a sus puntos al infinito (hiperbólico, por supuesto). En esta 
configuración aparecen sólo cuatro nuevos puntos de las intersec- 
ciones de las tangentes (pues la definición de terna ortogonal obliga 


a que las seis líneas consideradas se partan en dos tercias concut- 
rentes en los puntos espaciales de la terna). En nuestro caso, estos 
cuatro nuevos puntos son (+1,+1), que podemos identificar natu- 
ralmente con los cuatro cuadrantes, de tal manera que al primero 


le corresponde el (1,1). Así que al primer cuadrante lo podemos 
identificar con la cuarteta de puntos en P?: [e,], [e1], [ez], [ez] 
(donde es = e; + ez + e3), que fue nuestra 
cuarteta de batalla en las lides proyectivas y 
que llamábamos la cuarteta canónica. 

Si g € Pr(2) preserva el círculo unitario, 
manda a sus tangentes en tangentes. Manda 
entonces las cuatro tangentes consideradas en 
cuatro equivalentes que dan información más 
que suficiente para demostrar que g (le1]), g (lez]), 

g (lez]) es una terna ortogonal y que g ([e]) 
identifica a uno de sus cuadrantes. Por el teo- 
rema anterior (la primera aseveración), existe B € H (2) que le hace lo mismo a la 
cuarteta canónica. Por el Teorema de 4 en 4, g y (la que define) B son la misma 
transformación. O 


Tenemos también el subgrupo de transformaciones hiperbólicas que preservan ori- 
entación, que denotaremos H* (2). Es fácil ver que es el de matrices con determinante 
positivo y más precisamente, que 


H* (2) =(B € H(2) | det B = 1). 


Para este grupo hiperbólico orientado, el teorema equivalente al 8.4 es que H* (2) 
está en correspondencia con las parejas “punto en línea orientada” y que actúa simple 
y transitivamente en ellas. 


EJERCICIO 8.18 Encuentra la matriz de la transformación hiperbólica orientada que 
deja invariante al eje x, con todo y su orientación, y “traslada” el (0,0) al (1/2,0). 
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EJERCICIO 8.19 Encuentra una matriz hiperbólica que manda al origen, [ez], en el 
punto (1/2,1/2) y a la recta [e,1+ en la recta x = Y. 

EJERCICIO 8.20 Observa que las rectas hiperbólicas (n :2x+y=1)y [8:x+uy=1) 
son ortogonales. Identifica las cuatro matrices que mandan al eje x y al eje y respectivamente 
en ellas. 


8.3.4 Rotaciones y ángulos 


Veamos ahora ejemplos concretos, empezando por las transformaciones hiperbólicas 
orientadas que fijan el origen. 

Como se debió concluir en el Ejercicio 8.10, las extensiones del origen [ez] a una 
terna ortogonal tienen como puntos espaciales dos ortogonales en la recta al infinito, 
es decir, de la forma b =[s:t: 0] y a =|-—t:s: 0]. Al levantarlos a unitarios (dividir 
entre la raíz de su L-norma, que en este caso coincide con la euclidiana) de tal manera 
que, juntos, preserven la orientación, obtenemos una matriz 


cos8 —sin8 0 
Roa=| sin0 cose 0 | e H* (2). 
0 0 1 


Representa a la rotacion por un ángulo € alrededor del origen (pensando en H? Cc 
R? C P?, de la manera canónica). Éstas son todas las transformaciones hiperbólicas 
orientadas que dejan fijo el origen, y hemos demostrado la ecuación (8.1), que O (2) € 
H* (2) son las transformaciones que fijan al origen. 

Para obtener las rotaciones en cualquier otro punto c € lIH*, usamos el viejo truco 
de conjugar. Existe alguna matriz B € H* (2) que manda a c en [ez]; entonces la 
rotación de un ángulo O alrededor de c debe ser 


12 


Roo := B7 RaB, 


pues manda a c en [ez]; rota ahí, y luego regresa a c a su lugar original. Ya podemos 
definir ángulos en el plano hiperbólico usando a las rotaciones. 

Sean n y £ dos rectas hiperbólicas orientadas que se intersectan en c € H?. Defin- 
imos el ángulo de y a € como la única O € [0,271) tal que R¿g manda a n en € con las 
orientaciones correspondientes. Ésta no es una definición muy útil, pues para medir 
hay que encontrar alguna matriz de H* (2) que mande a c en el origen y ahí calcular. 
Sin embargo, veremos en la siguiente sección que hay una manera mucho más fácil 
de encontrar el ángulo. 


EJERCICIO 8.21 Demuestra que el ángulo es invariante bajo transformaciones hiper- 
bólicas. 

EJERCICIO 8.22 Demuestra que f e H* (2) tiene un punto fijo en H?2 si y sólo si f es 
una rotación. 


...Dibujo 
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EJERCICIO 8.23 Sea f e H* (2)) la rotación de un ángulo 1/2 en el punto (1 EZ o). 
Sin usar matrices, demuestra que permuta cíclicamente a los puntos (1,0), (1 112,1/ v2), 


(-1,0) y ( a Y v2). Recuerda que una transformación proyectiva está determinada 
por su valor en cuatro puntos, así que f ya lo está. Calculando dónde se intersectan los 
lados opuestos de este cuadrilátero, observa que se pueden encontrar los valores precisos de 
f(0,1) y f(0, —1). ¿Cuáles son? 

EJERCICIO 8.24 Usando el Teorema de 4 en 4 (ver ejercicio anterior), demuestra que 
dado un punto c € H? y dos rectas orientadas que pasan por él, hay una única f € H* (2) 
que deja fijo a c y manda una recta en la otra. (Ojo, si las rectas no son ortogonales no hay 
una permutación cíclica como en el ejercicio anterior; pero puedes echar mano de que por 
un punto pasa una única ortogonal a una recta dada). 


8.3.5 Traslaciones 


Una traslación (a semejanza de las otras dos geometrías) deja fija una recta orientada 
y preserva orientación; queda entonces determinada por a dónde manda un punto 
en ella (pues es la información suficiente para determinar un elemento de H* (2)). 
Como dos puntos en el plano hiperbólico, po y p¡ digamos, determinan una recta 
n = (po,p1), entonces definen una traslación. 

Veamos un caso particular: trasladar al origen (0,0) el punto e = (c,0) con 
—1<c<1 (donde estamos abusando de la notación c como punto o como número). 
La recta [e2)” con su orientación se queda fija y, por tanto, e debe ser la segunda 
columna. El punto espacial que nos falta es 


a=euntey!= (2,0) =[1:0:c]. 


Debemos ahora levantar y normalizar nuestra terna y obtenemos 


1 1 


u: = === (1,0,c) = == (1,0,c) 
1,0, 0) Mae 
VvV:x=e,) 
1 
w: = —=—(c,0,1) = (c,0,1). 


] 
—I(c,0, DR vI=0c 


Debemos entonces definir la traslación hiperbólica de (0,0) a (c,0) como: 
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que está bien (no hay que cambiar signos de u y V), pues su determinante es 1. 


Todas las matrices T,, con —1 < ce < 1, forman un subgrupo de H* (2) que 
llamaremos 7., como acrónimo de traslaciones en la recta [e,]7. Para ver que es 
un grupo basta observar que todos sus elementos tienen como puntos fijos a (—1, 0), 
(1,0) y [lez] (y por tanto preserva líneas verticales); en particular, la identidad es 
To. Podemos además orientar a 7¿, en el sentido creciente de su parametro c. Si 
tomamos cualquier punto en la recta hiperbólica [e2]*, es decir, de la forma (s, 0) 
con —1 < s < 1, sus imágenes bajo este grupo, 12.e., su órbita, es de nuevo la recta 
hiperbólica [e2]*; pero podemos extender muestro análisis de cómo actúa Te, al resto 
de P?. 


Si tomamos otro punto en H? (el (0,1/2) por ejemplo), su órbita es la mitad de 
una elipse con eje mayor el segmento del (—1,0) al (1,0). Para verlo, notemos que la 
ecuación de estas elipses es x? + by? = 1 para alguna b > 1 e A 
(en el ejemplo es x? + 4y? = 1); que, como elipse, se queda / A 
invariante bajo T., pues no es difícil ver que se tiene y X A / 


100 100 
UILODb ol lot 0 
0 0 -—1 0 0 —1 


que, recordemos, es cómo cambia la matriz asociada al poli- 

nomio bajo la transformación proyectiva T.. Así que si un 

punto cumple la ecuación, también lo hace su imagen bajo 

cualquier T.. Notemos que lo anterior también funciona para b < 1, extendiéndose 
nuestro análisis a todo el plano proyectivo, dándonos elipses altas e hipérbolas que 
se parten en dos órbitas. Éstas también se orientan del (—1,0) al (1,0); excepto sus 
dos tangentes a S!, cuando b = 0, donde aparece [ez] como punto singular. ¿Puedes 
hacer un dibujo de lo que pasa alrededor de [e>]? 


Este grupo de traslaciones Ze, =(T. | —1 <c < 1) nos servirá más adelante para 
medir distancias, pues las traslaciones deberían depender nada más de una recta 
orientada y una distancia. Pero por el momento podemos sacar dos conclusiones 
sobre distancias, aún sin haberla definido. 


Las elipses interiores (x? + by? = 1 con b > 1) deben ser los conjuntos 
de puntos a una distancia fija de la recta [ez]*, pues queremos que las 
transformaciones de H (2) preserven distancias. Así que una recta ultra- 
paralela a [e1* alcanza su distancia mínima a [e,]” en el punto en que es 
tangente a una de estas elipses y en ambas direcciones la distancia crece 
indefinidamente pues corta a todas las elipses exteriores. 
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Y como una recta paralela a [e,]+ (que tiene punto al infinito (1,0), 
digamos) cruza a todas las elipses, pues su tangente ahí es vertical, entonces 
tiene puntos tan cercanos a [e>]? como queramos. La distancia a [e,]+ 
tiende a cero por un lado y a oo por el otro. Por supuesto, esto mismo 
pasa para cualquier par de rectas ultraparalelas, y paralelas, pues con el 
grupo podemos llevar a [e,]* en alguna de ellas. 


EJERCICIO 8.25 Demuestra que para cualquier B € H* (2) existen T. € Té, y rota- 
ciones en el origen Ra, Rg tales que B = Ra Te¿Ra. (Piensa geométricamente, y las coordenadas 
polares son útiles.) 


EJERCICIO 8.26 Sean a= (0,0), b=(1/2,0) y c= (0, 1/2). Demuestra que 


2 e y v30.0 
Taecb == 0 v3 0 y Tera == 0 21 > 
VÍ 3 0 2 lo 12 


donde, en general, denotamos por Tg«p la traslación que manda a p en q (ambos en Hu). 


EJERCICIO 8.27 Con la notación del ejercicio anterior, demuestra que Tec aTacb 
Tec p calculando qué le pasa al punto polar de la recta (b, c) . 

EJERCICIO 8.28 Siguiendo con la notación anterior, sea x el ángulo de la recta (b, c) 
(con dirección de b a c) con la recta (b, a) (hacia a). Demuestra que ax < 1/4 (calculando 
que cos x = 2/v7 ) y por tanto que la suma de los ángulos internos del triángulo a,b,c 
suman menos que T. 

EJERCICIO 8.29 Demuestra que Tec-albra A Tocaleca calculando a dónde mandan 
al origen a; haz un dibujo. 


EJERCICIO 8.30 Demuestra que 


1 24 3 —12 
Teeb = 31 =11 24 16 
16 12 29 


EJERCICIO 8.31 Demuestra que Tac elec b Iba es una rotación Rg en a, donde O = 
2a— 7/2. Concluye que las traslaciones hiperbólicas no son un grupo. 

EJERCICIO 8.32 Vamos a cambiar de notación y a,b,c y d serán reales. Sea p = 
(a,b) € H?; sean c = Va? + b? y d = V1-—c?. ¿Cuál es la interpretación geométrica de c 
y d? Demuestra que la matriz de la traslación del origen (0,0) a p es 


a2+ db? ab(l—d) ac? 
qe | ab(15d) dat+b* be” 
hi ac? be? e? 


(Te conviene escribir las rotaciones en términos de a, b y c.) 


EJERCICIO 8.33 Da un ejemplo de dos rotaciones cuya composición es una rotación. 
Piensa geométricamente. 
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EJERCICIO 8.34 Demuestra que RqrRpn = Té p- 


EJERCICIO 8.35 Demuestra que si f € H* (2) deja fijo un punto espacial n (i.e., 
f (n) =m), entonces f es una traslación en n+o una rotación de 71 en un punto de n”. 


8.3.6 Traslaciones horocíclicas 


Las rotaciones dejan fijos puntos temporales y las traslaciones puntos espaciales. 
A las trasformaciones hiperbólicas orientadas que dejan fijo un único punto luz las 
llamaremos traslaciones horocíclicas; queremos ver que existen. 

Las traslaciones dejan fijos dos puntos luz, pues al dejar fija una línea hiperbólica 
orientada dejan fijos sus puntos al infinito. Las traslaciones horocíclicas sólo dejan 
fijo un punto luz y al haz de paralelas por él lo “traslada”, lo mueve en su dirección 
ortogonal sin dejar fijo ningun punto hiperbólico. 

Para fijar ideas, consideremos al punto luz po = (0, 1) (o, proyectivamente, Po = 
[0 : 1: 1]). Queremos construir una traslación horocíclica f centrada en po, es decir, 
que sólo fija py. Entonces debe mandar a su recta polar (pj : 

y = 1) en sí misma, y por tanto debe mandar a [ey] € p¿+ 

(que de hecho es su punto al infinito en la carta coordenada 

canónica) en un punto de la forma x = (x, 1) para alguna x € 

R, x 4 0 (abusaremos de la notación, usando igualdades para 

las inclusiones de las cartas coordenadas canónicas R CR? C 

P2 así que escribiremos x = (x,1) =[x: 1: 1] y nos facilitará 

la escritura). Para fijar ideas, veamos el caso particular en que [e1] (á= 00) va al punto 
2 = (2,1); el caso general se deja como ejercicio. 

La transformación f restringida a la recta proyectiva py es una función de Moebius 
que deja fijo a po (= 0). Si dejara fijo algún otro punto, éste sería espacial y tendríamos 
entonces una traslación hiperbólica común y corriente, pero queremos construir una, 
traslación horocíclica. Entonces f restringida a py es una traslación (de Moebius, 
con un solo punto fijo, recuérdese) que, junto con f (00) = 2, implica (véase Ejercicio 
8.36) que 


2x 
xl = A 


Ya tenemos un punto de la terna ortogonal que definirá a f. Sea 


(8.8) 


a =f (le1]) = (2,1). 


Queremos ahora encontrar b = f ([ez]). Sabemos que b tiene que estar en la línea 
polar de a, que tiene como ecuación 


ar: 2x+y=1, 


nos falta encontrar otra recta que pase por él. 
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La idea clave es que al saber cómo actúa f en la recta py, sabe- 
mos, en principio, cómo calcular la función f en el círculo luz. Dado 
un punto luz p € S', p 4 po, su tangente intersecta a la recta p? 
en el punto p* MN py que corresponde a una x. Al aplicar f, tan- 
gentes deben ir en tangentes, así que f(p) debe ser un pie de f (x). 
Pero uno de los pies ya está fijo, es po, asi que f(p) tiene que ser 
el otro. Los ejemplos importantes para nuestro problema son los 
puntos p1 := (1,0) y p_1 := (—1,0) pues sus tangentes pasan por [e>]; son sus pies. 
El cálculo con p_1 sale más bonito. Hagámoslo. 


pañp = 1,1 ==; 
f(-1) = -2=(-2,1); 
(2,0) : —x+y=1. 


Y ahora debemos encontrar las intersecciones de esta recta 
con S!' para deducir el pie faltante de (—2,1). Sustituyendo 
y =2x + 1 en el polinomio de S', se obtiene 


2+(x+DM?-1=x(5x+4). 


Estas raíces son x = 0 (ya lo sabíamos) y x =—4/5, lo que nos da (al sustituir en la 
ecuación de (-2,1)* o de S!) y =-3/5, y por tanto que 


f (p_1) =f (-1,0) =-1/5(4,3) =[4:3:-—3]. 


Y ahora sí, al intersectar su polar (4x+3y = —5) con a+ (2x+uy = 1), obtenemos 
a dónde debe ir [e>]: 


b = f ([e2]) = (4,7) =[M4:-7: 11. 


Finalmente, resolviendo otro sistema de 2 x 2, encon- 
tramos el punto temporal de la terna ortogonal como 


e=a-nb!*=1/9(4,1) =[4:1:9]. 


Levantamos a vectores L-unitarios, ajustamos los signos 
de los espaciales para eliminar la ambigiiedad de 4, y 
obtenemos que la matriz de f tiene que ser 


(844 
H=3| 4 71 
4-19 
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Es claro que el 2 que tomamos de ejemplo no tiene nada de particular y que para 
cualquier a 4 0, se obtiene una traslación horocíclica que manda a [e¡] en (a, 1). 
Dejamos como ejercicio ver que su matriz es 


Zas :—2a 2a 
Ha===| 2a 2a?-1 1 Ñ (8.9) 
2a —1] Zas 1 


Cuando a tiende a oo, H, tiende a la identidad, 1. Así que si la incluimos, obtenemos 
un subgrupo de H* (2): las traslaciones horocíclicas centradas en po =l0: 1: 1], que 
denotaremos 7,, (la notación extiende a puntos luz la de las traslaciones centradas en 
puntos espaciales) y que es isomorfo a las traslaciones de la recta real (en nuestro caso, 
identificada con P! — (0)). Orientado de oo a 1, veremos a continuación cuáles son 
sus órbitas. A las que quedan dentro de H? se les llama horociclos, y demostraremos 
que son las curvas que intersectan ortogonalmente a todas las rectas del haz paralelo 
centrado en Po. 

Las órbitas de T,, son las cónicas de la familia que 
tiene como “círculo de curvatura” en el (0,1) al cír- 
culo unitario S'. Además de ser tangentes a S' en el 
(0, 1): éste es el círculo que más se les parece infin- 


itesimalmente ahí (ver Ejercicios 8.41 y 8.42). Para 
demostrarlo, las definimos por la familia de polinomios 


Po (xy) =bx?+(y+0b 1?—b?, 


donde (0,1 — b) es su centro. Esta familia tiene a 
la recta doble (y — 1)? para b = 0; consta de elipses 
para b > 0; incluye a la parábola x? + 2y — 2 cuando 
b > oo, y da hipérbolas para b < 0. Con un cálculo 
directo, aunque engorroso, se puede ver que son invari- ' - 
antes bajo las transformaciones H,; es decir, que cumplen P, o H, = Py, donde P, es 
su polinomio homogeneizado. Entonces, si un punto está en una 
de estas cónicas, toda su órbita también lo está. 

Para 0 < b < 1, la elipse Pp (x,y) es un horociclo. Las tan- 
gentes a los horociclos en sus intersecciones con una recta hiper- 
bólica que pasa por py concurren en un punto de py, pues son la 
imagen bajo alguna H¿ de las correspondientes horizontales que 
concurren en [e¡]. A saber, tal recta es [a] + para algún [a] € py. 

Hemos exhibido a las traslaciones horocíclicas correspondiendo a las transforma- 
ciones de Moebius de una recta tangente al círculo luz que tienen como único punto 
fijo al de tangencia (ver Ejercicios 8.36 y 8.38). Veremos en la siguiente sección que 
esto no es casualidad pues nuestro razonamiento se extiende a cualquier transforma- 
ción de Moebius que fije el punto de tangencia. Pero, por el momento, concluyamos 
con que ya hemos descrito todas las transformaciones hiperbólicas orientadas. 
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Teorema 8.6 Sea f % id una transfomación hiperbólica que preserva orientación; 
entonces f es una rotación, una traslación o una traslación horocíclica. 


Demostración. Nótese primero que hay que evitar la identidad pues ésta califica 
para las tres clases. Sea B € H* (2) la matriz asociada a f. Puesto que toda matriz 
de 3 x 3 tiene al menos un vector propio, entonces f : P? — IP? tiene un punto fijo. Si 
este punto fijo es temporal entonces es una rotación. 

Supongamos ahora que el punto fijo, a digamos, es espacial. Sean q1 y q2 los pies 
de a. Como f (a) = a, estos pies van en sí mismos. Si se quedan fijos, 2.e., f (q;) = Q;, 
entonces f es una traslación. La única otra posibilidad es que f los permute. En este 
caso, consideremos la función f restringida a la recta a. Es una transformación de 
Moebius ahí, que permuta dos puntos pero manda a los dos segmentos (el temporal 
y el espacial) en sí mismos. Por el Ejercicio 8.43, tiene un punto temporal fijo y 
entonces es una rotación de 7 en ese punto. 

Finalmente, si el único punto fijo de f es luz, entonces f es por definición una 
traslación horocíclica. O 


EJERCICIO 8.36 Demuestra que si una transformacion de Moebius tiene como único 


punto fijo al 0 entonces es de la forma E para algún a 4 0, que es la imagen del infinito. 


EJERCICIO 8.37 Como calentamiento para el caso general, encuentra la matriz de la 
traslación horocíclica alrededor de po = (0,1) que manda a [e¡] en el punto (1,1). Sigue 
los pasos del ejemplo en el texto. 


EJERCICIO 8.38 Demuestra que la matriz de (8.9) es la traslación horocíclica centrada 
en Po = (0,1) que manda a [ej] en el punto (a, 1). (Hay una demostración constructiva y, 
al menos, una teórica donde necesitas el siguiente ejercicio; suponlo cierto.) 


*EJERCICIO 8.39 Demuestra que el polinomio característico de Ha es — (A — my. 


EJERCICIO 8.40 Usando al Ejercicio 8.38, encuentra una formúla para expresar 
cualquier traslación horocíclica. 


EJERCICIO 8.41 Considera a la elipse canónica b?x? + aly? = a?b? parametrizada 
por 9 >< p(0) = (a cos0,b sen0). Para cada 0 4 0, sea Cg el círculo que pasa por los 
puntos p(0),p(—8) y p(0) = (a,0). Demuestra que la abcsisa del centro del círculo Ca 
tiende a (a? - b?) /a cuando O tiende a 0. El círculo límite es el círculo de curvatura de 
la elipse en el punto (a,0). Con la misma idea se puede definir el círculo de curvatura en 
cualquier otro punto y para otras cónicas. 


EJERCICIO 8.42 Demuestra que S! es el círculo de curvatura de la elípse Pp (x,y) = 
bx? +y?+2(b-1)y—2b+1, con b >0, en el punto (0, 1). 


EJERCICIO 8.43 Demuestra que una transformación de Moebius que manda a un 
segmento en sí mismo, pero intercambia sus extremos, tiene un punto fijo. 
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8.3.7 Transformaciones hiperbólicas y de Moebius 
(su isomorfismo) 


Las transformaciones de Moebius han aparecido como herramienta en nuestro estudio 
de las transformaciones hiperbólicas, y como ya dijimos, no es por casualidad. Esta 
sección estará dedicada a demostrar su estrechísima relación. 


Teorema 8.7 El grupo de transformaciones hiperbólicas es naturalmente isomorfo, 
como grupo, al de transformaciones de Moebius, es decir, 


H(2) =Pr(1). 


La idea básica es identificar el círculo al infinito de H?, con la recta proyectiva P'. 
De hecho, ya lo hicimos con bastante éxito en la sección anterior tomando el punto 
fijo po = (0,1), y definiendo geométricamente una biyección S! — P' al intersectar 
p2 con las tangentes, que podemos escribir: 

p : SP! (=p) 
a l p=MPy para pkPo (8.10) 
Po para P=Po 
Nos conviene encontrar su expresión explícita en coordenadas pues 
la usaremos hacia el final de la demostración. 

Estamos identificando a IP! con la recta y = 1 en R?, que en P? está dada por 
la ecuación homogénea y = Z; y la manera natural de hacerlo es mediante la in- 
clusión que en coordenadas homogéneas toma la forma |[A: ul] > [A : 1: ul. Dado 
p = (a, B) € S!, queremos encontrar el punto p+ Mp+. Sabemos que p” está de- 
terminado por la ecuación lineal homogénea ax + By —z =0. Al sustituir z = y, 
obtenemos la ecuación 


12 


AX + (p — My =0, 
cuya solución es [x:y] = [1—f : ad; es decir p?+N py = [1—f: a: ad. Esto no 
tiene sentido para fB = 1, pues (a, fB) € S' implica que « = 0 y no se debe, ni se 
puede, hablar de [0 : 0]. Sin embargo, si suponemos que f 4 +1l se tiene, puesto que 
ol + p? = 1, que 
1-8: = (1+8)(01—8):(14+8)oJ 
= [1-8*:(148)a] =[0*:(14+ 8) a] =la:1+8]. 
Tenemos entonces que nuestra identificación del círculo unitario con la línea proyec- 
tiva tiene que ser 


p:Ss! >p! 
_f[—f:al para f 41 
0108) =4 lecTasfl vara pr (8.11) 


que aunque esté expresada de manera distinta en dos grandes pedazos (cada uno el 
círculo menos un punto), se tiene que en su intersección coinciden. 
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Un corolario importante de esta “talacha” que acabamos de hacer es que la iden- 
tificación de S' con PP? que estamos usando coincide con la clásica proyección es- 
tereográfica. Pues nótese que la última fórmula se puede pensar en dos tiempos. En 

su versión en R?, la función (a, B) —> (a, f +1) es simplemente 
trasladar una unidad hacia arriba. Y luego se proyectiviza a cada 
punto del círculo trasladado, que se puede interpretar como tomar 
la intersección de su recta por el origen (en donde quedó el polo 
sur) con la recta canónica y = 1 identificada con P! (en el origen 
hay que cambiar de definición y tomar el límite de las líneas: la 
tangente que intersecta en el punto al infinito). Así que la función 
(p coincide con la proyección desde el polo sur a la recta horizontal 
por el centro del círculo, justo la llamada proyección estereográfica. 

Una vez establecida la correspondencia entre S! y P!, conviene simplificar nuestra 
notación. Volvamos a pensar en P? como la recta real extendida y para x € P! = 
RU foo) (que también pensaremos como x € p¿) denotemos: 


— 71 1 
p:o=0  (xdES, 
en concordancia con el uso que dimos a Po,P1 y Poo en la sección anterior. 
Tenemos que demostrar ahora que al identificar así a S' con P*, las transforma- 
ciones hiperbólicas y las transformaciones de Moebius se corresponden. Es decir, que 
para cualquier f € H (2), la transformación Hu; : IP?! — P! definida por la ecuación 


y (x) = p (f (p,.)) 


es de Moebius. Y al revés, que es como vamos a proceder, que para cualquier trans- 
formación de Moebius y, existe una transformación hiperbólica f,, tal que 


fulPx) = Pu. 

Ya hemos avanzado en esto. Para las transformaciones de Moebius que fijan 
únicamente al 0, ya lo hicimos. Y las mismas ideas funcionan para el caso general. 
Demostremos que dada una transformación de Moebius u, entonces la función 

f,:58 =8 
fa (ps) = Pu(x) 
se extiende a una transformación hiperbólica. De nuevo, el punto será encontrar una 
terna ortogonal adecuada. 

Sabemos que u está determinada por sus valores en 0,1 e oo. Sean entonces 

do := Puo)» 41 := Pu(1) Y doo := Pu(oo) los puntos correspondientes en S!. Como la 
terna ortogonal canónica se define en términos de la “terna luz” canónica, 
Po, P1, Poo, cOmo sigue 


> 
! 


Po MPa; 
lea] = [lel*+np;y; 
les] = [eJ+nle*; 
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Entonces definimos 


a: = de M9; 
be ==: 
=b"na-. 


Esta terna se levanta a cuatro ternas L-ortogonales; pero es 
fácil ver que sólo una de ellas manda a nuestros tres pun- 
tos como queremos. Observemos que el cuarto punto de la 
cuarteta proyectiva canónica [ep] = le; + e, + ez] también 
se define como [€o] = p¿ Np+, así que hay que mandarlo a 
do M q; para que f € H (2) C Pr (2) quede determinada. 
Por lo tanto, la función f € H (2), diseñada para cumplir 


f (p.) = Pu(x) ls qx) para X= 0, 1 y 00, (8.12) 


existe y es única. Pero nos falta demostrar que su extensión a todo S! es como la 
transformación de Moebius u manda; es decir, que se cumple la ecuación anterior para 


cualquier x € P*. Esto, en notación funcional, equivale a probar que fop! = plop, 
pues recuérdese que 7! (x) = p,; así que nos queda por demostrar que 
pofop'=y. (8.13) 


Y esto es equivalente a probar que pofo q”! es una transformación proyectiva 
de la recta py en sí misma, pues ya coincide con | en la terna canónica (8.12). 

El caso en que f (po) = Po, es decir, que u (0) = O, es fácil, y casi se vio en 
la sección anterior. Pues entonces f es una función proyectiva de la recta p¿ en sí 
misma que, es lo que bastará demostrar, es igual a p of o qp”!, porque f preserva 
tangencia (o, en general, polaridad). Veamos. Para cualquier x 4% 0 se tiene que 
foo (x) =f (px) 4 f(po) = Po y entonces, usando la definición original de p 
(8.10), se tiene que 

p(f(p)) = f(p)"Npy =F (px) NT (po)” (8.14) 
= f(p)nt(p>) =f (p Nro) =F(x). 

El caso general en que f (po) 4 Po requiere más trabajo, pues f manda, proyec- 
tivamente, a la línea p¿ en otra línea (a saber, q¿ = f(po)” = 
f (p+)), y para obtener p ofo q”! hay que “bajarla” o “un- 
tarla” al círculo y volverla a “trepar” a py. Para x % 0, lo que 
sí sabemos es que tanto f (x) (€ q¿) como q (f (p,)) (€ pz) es- 
tán en la línea f (p.)7; lo primero porque x € p y lo segundo 
por definición de (q. Esta situación cae en el esquema general 
de una correpondencia natural que se establece entre las líneas 
tangentes al círculo, que llamaremos correspondencia tangencial. 
Nos conviene liberarnos un rato del problema que traemos, con 
todo y su notación que nos obstruye la visión, y establecer esto último con calma y 
sin la presión de demostrar. 
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Notemos que lo único que tiene po de especial es que facilita los cálculos, pero 
para cualquier otro punto en S', q digamos, hay una biyección natural py: S! = q+ 
que deja fijo a q y manda cualquier otro p € S! a p+N q* (compárese 

con (8.10)). Su inversa es simplemente mandar un punto y € ql a 

su otro pie en S! (q es el pie fijo, y se queda ahí, parado); es lo que 

habíamos llamado “untar” a q* en el círculo. Lo podemos volver a 

levantar a cualquier otra línea tangente —p* digamos, con p € S!-—, 

y obtenemos una biyección entre las dos líneas 

tangentes: su correspondencia tangencial, py o 

pa. Dicho de otra manera y genéricamente, 

y € q” corresponde tangencialmente a x € p” 
si y sólo si la línea (x,y) es tangente a S!. Nótese que es 
importante pensar el punto en su línea, pues si z =p*n q” 
(que es el único caso para que lo genérico no funcione) entonces 
z € p” corresponde a q € q* mientras que z € q” corresponde 
a p € p* (son sus dos pies). 

Puesto que la correspondencia tangencial surge, en el fondo, de identificaciones con 
un objeto único —el círculo—, es fácil ver que conmutan, es decir, que la composición 
de dos de ellas es otra; y es en ese sentido que usamos el término en singular. El punto 
medular para concluir con el teorema es demostrar que estas correspondencias entre 
líneas proyectivas son muy bien portadas. 


Proposicion 8.8 La correspondencia tangencial entre dos tangentes a S! es una 
transformación proyectiva. 


Demostración. Es claro que las transformaciones hiperbólicas preservan la corre- 
spondencia tangencial, pues esta no sólo está definida entre tangentes sino en base a 
tangentes (de S', por supuesto). Por tanto, podemos escoger nuestro par de rectas 
y, por conjugación —o contagio grupal —, si probamos la proposición ahí, será cierta 
para cualquier par. 


Pensando en R?, consideremos a p? y p2 parametrizadas, am- 
bas, por la primera coordenada (la segunda es 1 o —1 respectiva- 
mente). Dado p = (x,f) € S', vimos al principio de la sección 
que le correponde (1 — fB)/a en py, pero además vimos (8.11) que 
para B 4 +l esto es igual a a/ (1 + (3). Sustituyendo y =—1 en 
la ecuación de p* ( ax+ By = 1) se ve que a p le corresponde 
(1+f)/a en ph. De tal manera que la correspondencia tangencial 

entre Py y P se expresa en parámetros como x + 1/x, que es de Moebius. Ol 


Una observación que no podemos dejar pasar es que esto último, junto con el 
comentario que sigue a (8.11), implica que la proyección estereográfica del eje x a 
S! desde el polo sur, seguida de la proyección estereográfica desde el polo norte de 
regreso a R, es la función x > 1/x. 
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Ahora sí, tenemos todos los elementos para concluir la demostración del teorema. 


Demostración. [H (2) = Pr(1)] Si regresáramos a la frase donde nos desviamos de 
la demostración, (despuesito de (8.13)) concluiríamos que pofo q”! es f seguida de la 
correspondencia tangencial de f (py) a P+, y que por tanto po fo py”? es proyectiva; 
pero aprovechemos la distracción para recapitular y concluir de un solo golpe. 

Para una transformación proyectiva u de p+ en sí misma construimos, usando la 
identificación y : S' —= p¿, una transformación hiperbólica f € H (2) tal que pofop”' 
coincide con u en tres puntos. Estábamos en demostrar que p o fo q”? también es 
proyectiva pues, por el Teorema de 3 en 3, esto es equivalente a que coincida con u. 
Lo haremos ahora en general, mimetizando el caso que ya habíamos concluido con 
éxito (8.14). 

Sea q =f"! (po) € S' para que f (q) = po y f sea una transformación proyectiva 
de q+ en p¿. Entonces, para cualquier x € p¿ tal que q 4% p, = y '(x) € S!, se 
tiene, puesto que f (p,) 4 Po, que 


p(f(px)) =F(p)" Npy 
fp) =nt(g)=*(p:) nt (q) =F (pong). 
Nótese que pq? es la imagen de x € py bajo la correspondencia tangencial de py a 


q; entonces hemos expresado pofo«p”? como la composición de dos transformaciones 
proyectivas y por tanto es proyectiva. Concluimos entonces que 


pofop'=y (8.15) 


De aquí en adelante nada más falta comentar detalles. Obsérvese primero que 
en el último párrafo no se usó sino hasta la última línea de dónde viene f; es cierto 
entonces que para cualquier f € H (2) la transformación p ofo y! que va de p? en 
sí misma, definida por conjugación con «, es proyectiva. Así que, identificando a py 
con P!, como lo hicimos con cuidado al principio de la sección, tenemos una función 


H(2) => Pr(l) 
fo pofop” 


potfop” (x) 


cuya inversa es la que se llevó la parte constructiva de la demostración, y que (se 
deduce fácilmente de (8.15) despejando f) se escribe 


Pr(1) => H(2) 
up q ouog. 


Tenemos entonces la biyección natural del teorema. Pero además es un 1somorfismo 
de grupos pues en ambos sentidos preserva la composición (justo por estar definidas 
como conjugación). Por ejemplo, 


gota polgofJop '=(pogop ')o(pofogp”'). 


...Dibujo 
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EJERCICIO 8.44 Encuentra las matrices de las transformaciones hiperbólicas que man- 
dan a la terna luz canónica Po,P1,Poo respectivamente en 


[1:V3:2], [16-/3:21, [-1:0:1); 
(0,1), (1,0), (1,0); 
[4:3:5], [-4:3:5]1, [0:—1:1]. 


EJERCICIO 8.45 Demuestra que la función inversa de y (8.11) tiene la forma 


A 


EJERCICIO 8.46 Recuerda de la Sección 6.2.5 la clasificación de transformaciones de 
Moebius; ¿a qué tipo de transformaciones hiperbólicas corresponden? 


rm. ads e 
p (00300) = a (Po 2). 


EJERCICIO 8.47 Demuestra que si f € H (2) invierte orientación, entonces es una 
reflexión (deja fija, punto a punto, a una línea hiperbólica llamada su espejo, e invierte sus 
dos lados) o es un paso (una reflexión seguida de una traslación en el espejo). 
EJERCICIO 8.48 Demuestra que dos líneas hiperbólicas son ortogonales si y sólo si sus 
extremos forman una cuarteta armónica (identificando al círculo al infinito con P”). 
EJERCICIO 8.49 ¿Qué tipo de transformación se obtiene de la composición de dos 
reflexiones? 


8.4 Métrica 


Vamos ya a acabar de definir las nociones básicas de ángulo y distancia en H? de tal 
manera que el grupo las preserve. Conviene pensar y hacer las cosas formales en el 
modelo de la cazuela hiperbólica H? C RS. 


8.4.1 Ángulos 


Ya definimos ángulo con base en las rotaciones, que debía ser llamado el ángulo 
orientado, pues se definió como el ángulo de la rotación que lleva una recta en otra 
y toma valores entre —7t y TT O bien entre 0 y 271. No es simétrico sino antisimétrico, 
pues la inversa de esa rotación (menos el ángulo) nos regresa a la original. Y esta 
noción que en el origen hiperbólico, ez, coincide con la euclidiana se difundió a todo 
HH? por medio del grupo H (2). Veremos ahora cómo calcular fácilmente su versión 
simétrica, el ángulo con valores entre O y Tr, para dos rectas orientadas. 

En la Sección 8.3 vimos la correspondencia natural entre vectores L-unitarios es- 
paciales y rectas hiperbólicas orientadas; denotémosla con u + u+, donde u” denota 
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ahora una recta hiperbólica orientada. En el “origen hiperbólico”, ez, esta corre- 
spondencia es la euclidiana; una recta orientada por ez es (la intersección con) un 
plano vertical y su vector asociado es su ortogonal (con tercera coordenada igual a 
0). Y como para estos vectores el producto interior euclidiano corresponde al de 
Lorentz-Minkowski se tiene que 


4(u+,v+) =arccos (u e; v) (8.16) 


correponde a nuestra definición previa usando al grupo SO (2) € H (2). 

Simplemente hay que extender esta fórmula a cualquier par de rectas hiperbólicas 
orientadas u y v* concurrentes para definir su ángulo. Expresa lo que queremos 
geométricamente, pues al actuar por elementos de H (2) se queda invariante, así 
que corresponde a llevar su intersección al origen y ahí medir con el grupo. En 
particular, si dos rectas hiperbólicas u- y v* se intersectan se tiene que [u e, v| < 1 
y 4(u*,v*) e [0,71], donde los extremos se dan si y sólo si u = +v. 

Conviene extender la fórmula para calcular ángulos a vectores no necesariamente 
unitarios. Para cualquier v € R*, denotemos por 


lvll, := 4/1 


a su L-tamaño. Nótese que el término “L-norma” debería aplicarse aquí en estricta 
analogía con el caso euclidiano, y deberíamos haber usado “L-norma cuadrada” para 
wit; pero como esta última es la más usada preferimos simplificar la terminología y 
usar y acuñar, hasta ahora que lo necesitamos, un nuevo término para la raiz del valor 
absoluto de la L-norma, que sólo sirve para normalizar, esto es, para hacer L-unitario 
a un vector no luz. 

Se tiene entonces que si U y V son vectores espaciales cuyas rectas polares son 
(hiperbólicamente) concurrentes, 


4(u+,v+) = arccos (ar) ; (8.17) 
hall, lvl 

Veamos un ejemplo sencillo pero iluminador. Pensando en el modelo proyectivo 
(H? c R? C P?), consideremos la familia de rectas con una pendiente euclidiana dada 
y calculemos su ángulo hiperbólico respecto al eje x, es. Sea (a, b), con a > 0 (para 
simplificar expresiones, pero a 4 0 funciona), un vector euclidianamente unitario (es 
decir, tal que a? + b? = 1), de tal manera que el haz (euclidianamente) 
ortogonal a (a,b) está dado por las ecuaciones 


ax + by = ac, 


donde c, variable, parametriza su intersección con e, que es precisa- 
mente (c,0). Sea u, = (a, b, ac), así que estas rectas son sus (L-) polares 
y son hiperbólicas para |c| < 1/a. Se tiene que para estos valores de c: 


Dibujo: 
grafica 
p(c) 


de 
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e, e, Ue b 


[pue ll, y 1= a2c2 

Llamemos p (c) a esta función con dominio —1/a < e < 1/a. Notemos primero que 
si b = 0 (si nuestras rectas son verticales), p (c) es constante 0 correspondiendo al 
hecho de que Lu; ) son las ortogonales a ez. Supongamos que b > 0 (el caso análogo 
b < 0 se deja como ejercicio). Entonces p(c) tiene un mínimo, b, en c = 0, es 
simétrica (p(c) = p (—c)) y cumple que p(c) < 1 para —1 < c < 1, alcanzándose 
la igualdad en los extremos. Esto último corresponde a que u; es concurrente a ez 
cuando [c| < 1, y cuando c = +1 son paralelas (con (+1,0) como punto común al 
infinito); para |c| > 1, p(c) > 1 y las rectas u> y ez son ultraparalelas. Entonces 
p (c) cae en el dominio de la función arcocoseno sólo en los dos primeros casos. En el 
primero, se aplica la fórmula (8.17), pero ésta se puede extender continuamente 
de pares de rectas concurrentes para incluir pares de rectas paralelas, lo que nos 
da que el ángulo de estas últimas es 0 (o 7T para el caso b < 0; ver Ejercicio 8.53). 

Que p(c) sea simétrica corresponde a que la rotación de TT en el orígen lleva a 
ez en sí misma y a u¿ en u”, invirtiendo orientación en ellas y consecuentemente 
tienen el mismo ángulo. Finalmente, que la función p(c) baje de 1 a b mientras 
c va de —1 a 0 y suba simétricamente a 1 al seguir c de 0 a 1, implica que el 
ángulo 4(u-, ez) empieza en 0 para c =—1, sube monótonamente hasta alcanzar su 
máximo, arccos (b) = 4(uz, ez), en c =0 (que coincide con el ángulo euclidiano) y 
vuelve a bajar monotona y continuamente a 0 cuando c = 1. Como corolario de este 
hecho tenemos la siguiente proposición. 


Proposicion 8.9 Existe un polígono hiperbólico regular de n lados y ángulo interno 
a para cualquiern>3y0<a<nin-2)/n. 


Demostración. Consideremos (a,b) = (cos (1/n) ,sen (1/n)) en la discusión ante- 
rior. Se tiene entonces que 


(1.2 


lonly_ 
De 4(u;,,ez)=7 % 
De nuestra última observación se sigue que existe una única c conÚ0 < e < 


1, para la cual 4(u?,ez) = a/2. Sea P. el polígono regular euclidiano 
de n lados con centro en el origen y vértice en (c,0); nótese que está 
contenido en el plano hiperbólico. Su grupo de simetrías es el grupo 
diédrico de orden n, D,,, generado por las reflexiones en ez y la recta por el origen 
con dirección (a,b). Como D, € 0 (2) € H (2), este polígono, considerado en el 
plano hiperbólico (puntos y segmentos de rectas ordenados cíclicamente), tiene todas 
las simetrías hiperbólicas posibles, es decir, cualquier par incidente “vértice-lado” se 
puede mandar en cualquier otro, y eso es lo que llamamos regular. Entonces todos 
sus ángulos internos son iguales y, por construcción, son iguales a A. Ol 
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Un caso importante es el límite cuando el ángulo a de los triángulos regulares 
tiende a 0; se les llama triángulos hiperbólicos ideales. Están formados por 
tres líneas hiperbólicas 2 a 2 paralelas, pierden sus vértices pues quedan en 
el infinito, y por el Teorema de 3 en 3 no importa qué tres puntos se tomen 
en S!; son equivalentes. Resulta que su área es 71 (con la noción natural de 
distancia que ahí viene) y es la máxima área que puede tener un triángulo 
hiperbólico. 


EJERCICIO 8.50 Encuentra el vértice (c,0) de un cuadrado hiperbólico regular cen- 
trado en (0,0) con ángulo interior 71/3, y el de un hexágono con ángulo 1/2. 


EJERCICIO 8.51 — Define un triángulo isósceles como un triángulo con dos ángulos 
iguales. Demuestra que la suma de ángulos de un triángulo hiperbólico isósceles es menor 
que T. 


EJERCICIO 8.52 Considera el ánalisis del ángulo entre ez y u- que dejamos pendiente, 
es decir, cuando b < 0. Demuestra que <(u2,ez) baja de Ta 4(u/, ez) = arccos (b) 
conforme c va de —1 a 0 y luego vuelve a subir simétricamente. 


EJERCICIO 8.53 Sean u y v dos vectores espaciales unitarios tales que [u] 4 [v]. Ya 
vimos que si sus líneas polares son concurrentes entonces [ue v| (en valor absoluto) es menor 
que 1. Demuestra que sus líneas polares son paralelas o ultraparalelas correspondiendo 
respectivamente a que |uer v| sea igual a 1 o mayor que 1. 


8.4.2 Distancias 


Por fin vamos a deducir la noción de distancia. Ya sabemos trasladar en rectas pero 
aún no sabemos medir distancias en ellas. Claramente estas dos nociones deben 
corresponderse; dada una traslación, cada punto en la recta y su imagen deben estar 
a la misma distancia. Veremos que esto obliga (salvo una constante) a la noción de 
distancia. Como todas las rectas hiperbólicas son iguales pues ya tenemos el grupo, 
bastará concentrarnos en una que pasa por el “origen” ez para luego propagar la 
noción. Las rectas por ez son aún “más iguales”, se ven (pensaremos, ahora sí, en 
la cazuela hiperbólica) como una rama de una hipérbola canónica en ¡R?, así que 
simplifiquemos las cosa y estudiemos esta última. 


Lorentz en dimensión 2 


Hasta nuevo aviso, denotemos con L a la análoga de la matriz de Lorentz en dimensión 
2, que podríamos llamar “la Lorentzita” 


EN 
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Usemos ue,v=u'lv y hulí = Ue U para denotar, respectivamente, a la forma 
bilineal y a la forma cuadrática asociada (x?—y?); donde ahora u, v € ¡R?. Igualmente, 
usaremos toda la terminología que desarrolamos para el caso de dimensión 3. Una 
gran diferencia es que ahora hay una correspondencia entre los vectores unitarios 
temporales y espaciales; ambos son hiperbólas cuadradas; la única diferencia es que 
una se abre hacia el eje y (la temporal) y la otra es “horizontal” (la espacial). Tenemos 

entonces una clara noción de compadre L-ortogonal (análoga a la 
euclidiana) pues si declaramos, cambiando la notación para que 


» no se confunda con el ortogonal euclidiano, 
Ñ 
(x, y)" =(y,x), 
claramente se tiene que ue, ul =0 y Jul; =— Jul e Intercambia 
temporales por espaciales dejándoles la misma magnitud en valor 
absoluto. Los vectores luz forman dos rectas, una (la x = y) 


...Dibujo 


donde el compadre L-ortogonal es el mismo vector, y la otra (la 
x= A ) donde es su inverso. El compadre L-ortogonal tiene un elegante significado 
geométrico (análogo también al euclidiano respecto a los círculos). 


Lema 8.10 Dado u € R?,u 4 0, entonces ul es tangente en u a la curva de nivel 


de la función bcle que pasa por u, es decir, a la curva Cy := lx e R? | xlé = hu). 


Demostración. Obsérvese primero que las curvas de nivel C, están definidas por 
una ecuación x? — y? = cte, y que por tanto son cónicas de las que sabemos hablar 
de sus tangentes. En el caso en que u es un vector luz (la cónica degenera en dos 
rectas) el lema es claro por la descripción de u!* 

Supongamos entonces que hul HF 0. Para ver cómo intersecta la recta [u*|] +u 
a la curva de nivel, tomemos un vector tu! trasladado a u y evaluemos la forma 
cuadrática: 


tul + ul = (tu-+u) e, (tu! +u) 
= (tu!) e (tul) + (tu') e u+ue tu +ue u 
t? (ul e ul) 4 2t (u! e u) + [ulj 
E ul? + puff. 
Puesto que luli F 0 entonces ut HF 0, y de la ecuación anterior se deduce que 


lt ul + ul; = hu, si y sólo si t= 0. Por tanto, la recta [ul] + u intersecta a Cy 
justo en u y es entonces su tangente ahí. Ol 


Estudiemos ahora la rama positiva de temporales unitarios, que podemos llamar 
la “recta hiperbólica” 


ur =(x€ 21d =-1, x-e2>0). 
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Como en el caso de dimensión 3, tenemos el grupo O (1,1) de matrices que dejan 
invariante la forma bilineal de Lorentz (o bien, tales que B'LB = L o, equivalente- 
mente, que sus columnas forman una base L-ortonormal). Dentro de éste, tenemos 
el subgrupo que manda a H' en sí mismo, que llamamos H (1), y dentro de éste el 
de aquellas que preservan la orientación, H* (1). Siguiendo los pasos del caso de 
dimensión 3, no es dificil ver que este último grupo es 


em=((e y) lae=-1,9>0), 


(es fácil comprobar que estas matrices cumplen que B'LB = 
L). Para u = (a,b) € H', denotemos 


b a 
du = Tanya ( ed ) A (8.18) 


que es la traslación que manda al origen de la recta hiper- 
bólica, ez, en u, y desplaza a todo HI' dentro de sí mismo. 
Esta transformación líneal en IR? “aplasta” un cuadrante (en el que está u) hacia su 
recta luz, o, mejor dicho, lo “alarga” pues preserva área, y compensa con un acor- 
tamiento de la otra recta luz; sus vectores propios son los luz con valores propios a+b 
y b=—a. 

Obsérvese que (8.18) establece una biyección HI! => H* (1) que a cada punto le 
asocia la traslación que manda al origen en él. Nuestro problema actual es encontrar 
una distancia en H' que logre que estas traslaciones sean rígidas. 

Puesto que H! es topológicamente una recta, encontrar una distancia en HI! com- 
patible con estas traslaciones equivale a parametrizar adecuadamente H'. Es decir, a 
encontrar una función 


h:R> H' 


que convierta a la suma (las traslaciones en RR, a partir de las cuales ahí se define 
distancia) en nuestras traslaciones hiperbólicas. Es decir, tal que al componerla con 
la biyección HI! —> H* (1) mande a la suma en composición, que se escribe 


Thtt+r, = Tnto Tío - (8.19) 


Evaluando en el origen, la parametrización h que andamos buscando debe cumplir 
entonces que 
h (t+r) = Tn) (nt), (8.20) 


pero además, como las traslaciones de H* (1) quedan determinadas por su valor en 
el origen, esta condición es equivalente a la de homomorfismo (8.19). En particular, 
como la traslación por 0 es la identidad en R, y Te, es la identidad en Hl', h también 
debe cumplir la condición inicial: 


h (0) = ez. (8.21) 
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Antes de deducir formalmente cuál es la parametrización h que cumple estas 
condiciones, vale la pena preguntarse ¿qué es lo más bonito que puede pasar? Pues 
con inusitada frecuencia en matemáticas la respuesta a esta última pregunta es la 
correcta, o al menos es premonitoria. Manténgase también en mente la analogía de 
que medir ángulos equivale a parametrizar adecuadamente a S'. 

Hemos visto (Lema 8.10) que para cada punto u de H'', su compadre L-ortogonal 
ul es un vector tangente a H'. Entonces H' viene dado junto con un campo de vectores 
natural, es decir, en cada punto u € H' hay un vector tangente distinguido, ul. Un 
punto, o partícula, viaja en H' acorde con este campo vectorial si en cada momento su 
velocidad coincide con el vector tangente distinguido. Como estos 
vectores varían continuamente, es intuitivamente claro que se puede 
viajar de esta manera; el campo vectorial de compadritos define 
cómo deben moverse internamente los puntos. Si llamamos h a la 
función de posición de una partícula que viaja acorde con el campo, 

» y la ponemos en el origen en el tiempo 0, 1.e., h(0) = e,, obtenemos 

al candidato ideal para la parametrización. Pues obsérvese que 
cada punto sabe dejarse llevar por el flujo, así que si los ponemos a todos juntos 
y “agarrados” de la mano, se mueven coherentemente dando lugar a traslaciones. 
Entonces la condición de homomorfismo (8.19) equivale a dejar correr a HI! con el 
flujo por un cierto tiempo r, ahí tomar una foto instantánea (Tn): dónde anda cada 
uno), y luego dejarlo correr otro rato t; al final, simplemente se le dejó correr un 
tiempo t + r. Pero ¿por qué coinciden estos movimientos de acuerdo con el flujo 
con nuestras traslaciones hiperbólicas? Pues, como veremos, porque estas ultimas 
preservan el campo vectorial ya que preservan al L-compadrazgo. 

Más formalmente, lo que le estamos pidiendo a la parametrización h : R > HI 
dada por el flujo es que su derivada sea el compadre L-ortogonal. Si expresamos h en 
coordenadas, h = (h,,h>), donde hi y hy son funciones de R en R, entonces tenemos 
una condición inicial y una diferencial 


h (0) = e, 5 (hi (0), ha (0)) = (0, 1); 
H=h! ras (h,,h) = (h2,h;). (8.22) 


Aunque la ecuación diferencial intercambia índices, de ella se sigue que hf = hy; es 
decir, ambas son funciones cuya aceleración es su valor: cuanto más lejos (positivo) 
del 0 estén, más aceleran y agarran una velocidad “endemoniada”. Por ejemplo, de 
hi sabemos que hy (0) = 0, que hi (0) = 1 y que hf = hy. No es este el libro para 
hacerlo en detalle, pero heurísticamente si determinamos la posición y la velocidad 
inicial y damos una regla para la aceleración de acuerdo con la posición, la función 
debe estar determinada de manera única. Si suponemos esto (que se sigue del Teorema 
de unicidad y existencia de soluciones de ecuaciones diferenciales —y que al manejar 
un coche con el simple acelerador se corrobora todos los días—), ya tenemos candidato 
para la parametrización h; sus coordenadas tienen nombres clásicos: hi es el seno 
hiperbólico y hz el coseno hiperbólico, que se denotan senh y cosh respectivamente. 
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Aún suponiendo que ya tenemos h = (senh, cosh) que cumple (8.22), nos falta 
demostrar más formalmente que cumple (8.20); si se lo cree ya el lector, sáltese la 
siguiente subsección que tiene que ver más con cálculo. 


*Los cálculos 


Queremos probar que la condición de homomorfismo (8.20) es equivalente a la condi- 
cion del “flujo de compadrazgo” (8.22), bueno, casi. Supongamos entonces que 
h : R>H' cumple que h(0) = e, que es la parte común. Veamos primero que 
(8.20) implica algo un poco más general que (8.22). 

En coordenadas (8.20) se expresa, usando (8.18), como 


aaa Ea o) 
ha (t +1) a hi (t) ha (t) h, (r) 
(t) ) + hy (t) ha (1) ) 
(tits tr yo 


Que son las identidades aditivas para el seno y el coseno hiperbólicos. 

De estas dos ecuaciones podemos sacar condiciones diferenciales que deben cumplir 
las funciones. Consideremos la segunda, y con base en su identidad para la suma 
expresemos su derivada en la forma clásica de límites: 


1sto = hi (PLbEn rta) 
sia 
r>0 Y 
e € (t) lu (1) + ha (4) (ho (1) — 2 
r>0 r 


E € (t) hu 2) lim (5 (t) (ha (r) — 2) 
r>0 T 10 m 


=0 T r>0 T 
= hy (t) in ( NOAA 2) + ha (t) lim (E (0 +) = ha 2) 
10 T r>0 Tr 


r] 


Pero además h va por la hipérbola IHl' y pasa por su mínimo en el 0, lo cual implica 


que h) (0) =0. Así que se cumple 
ho (t) = hy (0) hu (t). 
De un cálculo análogo (que dejamos como ejercicio) se obtiene que 


hy (t) = hi (0) ha (t). 


Dibujo, 
graficas 
cosh y senh 


de 
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Éstas son, salvo la constante hi (0) (el casi de la equivalencia), las ecuaciones (8.22). 
Esta constante correponde a viajar con velocidades distintas en el flujo, o bien, con- 
siderar múltiplos del campo vectorial. Sin embargo, si tomamos esta constante igual 
a 1 tenemos que la condición de homomorfismo (8.20) implica la del flujo (8.22). 

Supongamos ahora que h' = h! (8.22), y vamos a demostrar que h(t+r) = 
Ta (h(r)) (8.20). La idea básica es que podemos reparametrizar y luego usar (es 
inevitable) la unicidad de soluciones. 

Pensemos a t como una constante; es más, denotemos u = (a,b) = h(t) y 
definamos la función g : R —>HI' como 


9(r) =T,* (h(t+r)). 


Claramente se cumple que g (0) = ez. Además, derivando con respecto a Tr y como 
la matriz T,' es constante, y multiplicar por ella es lineal, se cumple que 


E L 


9)=1 1040) =T7 (Ht+90)= (1 (Mht+D)=9 0", 
pues T,,' € H* (1) y es fácil ver que estas matrices preservan el compadre L-ortogonal. 
(Si alguien se siente incómodo con que hayamos derivado vectores, o que haya entrado 
la derivada tan fácil, se le invita a hacer las cuentas en coordenadas usando (8.18) y 
el Ejercicio 8.54). Entonces g cumple las mismas condiciones que h y por la unicidad 
de soluciones se tiene que son la misma parametrización de H'. Multiplicando ambos 
lados de la ecuación h = g por T,,, tenemos 


Ta (h(1)) = Tu (9g(1)) = Tu (T,' (h(t+1))) = h(t+1), 


que es lo que queríamos demostrar. 


EJERCICIO 8.54 Demuestra que si T, es como en (8.18) entonces 


b —a 

po | 0 

ls ( a ) | 

EJERCICIO 8.55 Demuestra que si T € H* (1) entonces T (ut) = (Tu). 


EJERCICIO 8.56 Demuestra que si h : R —>H'' cumple la condición de homomorfismo 
(8.19), entonces g (t) = h (ct) para cualquier constante c % 0, también la cumple. 


Seno y coseno hiperbólicos (distancia en H!') 


Resumiendo, tenemos que la función h = (sinh,cosh) es una biyección de IR con H' 
que hace corresponder a las traslaciones reales con las hiperbólicas, pues las fun- 
ciones trigonométricas hiperbólicas, cosht y sinht (cuyas gráficas aparecen al mar- 


gen) cumplen: 


8.4. MÉTRICA 377 


cosh?t — sinh?t = 1 
cosh O = 1 sinh0 =0 
cosh't = sinht sinh't = cosht 
cosh (t + r) = cosht coshr +sinht sinhr 
sinh (t + r) = cosht sinh r + sinht coshr 


La distancia en HI! debe ser 
d(h(t),h (r)) = [tr]. 


Para expresarla sin referencia a h, podemos usar la inversa del coseno hiperbólico, 
cosh”' t, que tiene sentido sólo para t > 1, que, por definición, siempre toma valores 
positivos, y que de la segunda coordenada de un punto en H' nos dice, en valor 
absoluto, de qué t proviene. En efecto, para el origen ez = h (0), se tiene que 


d (ez, h (t)) =|t] = cosh? (e, - h(t)) = cosh' (— (e, e, h(t))). 


Esta última expresión (como en los ángulos) es la base para generalizar, pues podemos 
definir entonces para cualquier u, v € H': 


d (u,v) =cosh"! (— (u e v)). 


Que es claramente invariante bajo H (1) y concuerda con la distancia al origen; hace 
que la parametrización h sea una isometría. 


Distancia en H? 


Regresando al plano hiperbólico H? C R3, debe ser claro que la buena definición de 
distancia de u a v (puntos de H?) es 


(8.23) 


Pues es claramente invariante bajo H (2) ya que estas transformaciones preservan la 
forma bilineal de Lorentz y entonces el resultado de la fórmula no cambia. Además, 
hace justo lo que queremos, pues dados cualesquiera u, v € H? podemos trasladar al 
origen con alguna f € H (2) tal que f (u) = ez, entonces 


d(u,v) = cosh' (— (ue, v)) 
= cosh”' (— (f (u) er f (v))) 
= cosh' (—(ez el f (v))); 


y — (ez er f (v)) es precisamente la tercera coordenada de f (v), que, vista en el plano 
vertical correspondiente, igual a ¡R?, es la segunda coordenada de un punto en Hl'. 

Por está última expresión, como todos los puntos de HI? están arriba de ez, se tiene 
claramente que d (u,v) =0 si y sólo si u =vV ; o bien, que ue, v< —1 y la igualdad 
se da si y sólo si u = v. Pero nos falta probar la desigualdad del triángulo para 
ver que hemos definido a una distancia con todas las de la ley. 
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Sean u,v, w tres puntos en la cazuela hiperbólica JH"; 


queremos demostrar que A 


d (u,v) + d (v,w) > d(u,w). AT 


Podemos suponer que u = €z y además que v está en el 
plano yz, y entonces que se escribe v = (0, a,b). Sea c la Ue 
altura de w, es decir, Cc = w - €3 que es la que determina la, j 
distancia a €3. Si v estuviera más alto que w (o sea, si b > c) entonces d (u,v) > 
d(u,w) y ya no hay nada que demostrar; supongamos entonces que v está debajo 
de w. Sea v' el punto en el rayo de u a v que está a la altura de w; de tal manera 
que d (u, w) = d (u, v”), es decir, ambos están en un círculo hiperbólico centrado en 
e3, que es la intersección de JH? con el plano horizontal z = Cc. Nótese que los círculos 
horizontales TM, MN IB, donde TT, : z = r, son los círculos en torno a ez, esto es, los 
conjuntos de puntos con una misma distancia a €z. 

Sea T € H* (2) la traslación hiperbólica que lleva a v al origen hiperbólico ez. Es 

fácil ver que es la matriz 


1.0 0 
T=|0 b —a 
0 —a b 


y que ésta lleva a los planos horizontales TI, en la familia de 
planos ay + bz = r normales al vector (0, a,b). De aquí se 
sigue que la imagen del círculo TT. N A? es una elipse con un 
único punto de tercera coordenada mínima, a saber T (v'). Por 
tanto, T (w) está arriba de T (v”) y se tiene 


d(uw)=d(uv) =d(uv)+d(vv)<d(uv)+d(v,w), 


con la igualdad si y sólo si u, v, w son colineales (pues la igualdad se da si y sólo si 
d (v,v') = d (v,w), si y sólo si T (w) coincide con el mínimo T (v”)). 

Como corolario de la demostración, obsérvese que los círculos hiperbólicos alrede- 
dor de un punto cualquiera u € H? son las intersecciones de la cazuela HI? con los 


planos paralelos a su plano tangente en u; pues esto es cierto en ez. 


EJERCICIO 8.57 Demuestra que el conjunto de puntos que equidistan de dos puntos 
dados es un recta, llamada su mediatriz. 


EJERCICIO 8.58 — Recuerda que dos líneas ultraparalelas tienen una única perpendi- 
cular común, y observa además que si tienen una perpendicular común son ultraparalelas. 
Demuestra que los puntos de intersección de la perpendicular común con las rectas es donde 
se realiza la distancia mínima entre ellas (usa las reflexiones y la desigualdad del triángulo). 
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8.4.3 Triángulos 


Queremos demostrar que la suma de ángulos de un triángulo hiperbólico es 
menor que TT, y convencer que su área es acotada. 


Un triángulo hiperbólico está determinado por tres puntos a,b,c (ya no será 
relevante si los pensamos en P? o en R*; también los podemos pensar en abstracto), 
pues, como en el caso euclidiano, quedan determinados los segmentos que definen y 
sus ángulos internos, llamémosles a, fB, y respectivamente. 


Consideremos primero el caso de un triángulo rectángulo: supongamos que 
y = 1/2. Sea l la recta ortogonal a (c, b) en el punto b y observemos (Ejercicio 
8.58) que el segmento bc realiza la distancia de la recta l a la recta (a, c). Sea 
f la rotación de 7 en el punto medio del segmento ab. Se 
tiene que f(a) =b y f(b) = a; queremos ver que f (c) está en 
la franja entre l y la recta (a, c). Si f (c) estuviera del otro lado 
de l que c entonces el segmento de f (c) a a =f (b) intersectaría 
a l y tendríamos que la distancia de l a la línea (a, c) es menor 
que d(b,c) contradiciendo el Ejercicio 8.58. Y se contradice 
la unicidad de la perpendicular común si f(c) € fl; por tanto, 
f(c) está del lado de a (y c) de la recta £. Esto implica que 
a+ f <r/2 y por lo tanto que a+ B+y< Tr. 


Consideremos ahora cualquier triángulo. Tracemos la perpendicular a un 
lado desde el vértice opuesto, c digamos, que podemos llamar la altura de c. 
Hay dos casos por analizar; cuando la perpendicular corta en el segmento ab, 
y cuando corta a la línea (a, b) fuera de él. En el primer caso tenemos que el 
triángulo original se parte en dos triángulitos rectán- 
gulos. Como en cada uno de ellos la suma de sus dos ángulos 
no rectos es menor que 7/2, la suma de los tres ángulos del 
grande da menos de 7. El segundo caso se reduce al primero, 
pues al tomar la altura de los otros dos vértices, alguna de 
ellas parte el triángulo en dos. Esto completa la prueba de que x+ fB + y <T. 


Al hacer con cuidado las cuentas de este último razonamiento aparece algo más 
profundo (o preciso) que conviene analizar. Dado un triángulo T con ángulos internos 
a, K, y podemos definir su déficit angular como 


¿(MM =x1—(a+p+y). 


Queríamos demostrar que el déficit angular de cualquier triángulo es positivo. Lo 
hicimos primero para triángulos rectángulos; y al extender este resultado descom- 
poniendo un triángulo en dos triangulitos lo que se usa en el fondo es que el déficit 
angular es aditivo. Veámoslo en general. 
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Si tomamos cualquier punto de un lado de un triángulo T y trazamos el seg- 
mento al vértice opuesto, c digamos, se obtienen dos triangulitos Ty y T2 con ángulos 
complementarios nuevos 61 y 6, de tal manera que 


S(hi+5(B) = 1=[(a+0 +1) +=[(B+02+Y2) 


B 
B 


! 
NS) 
A 


O bien, si tomamos un punto en el interior de T y subdividimos en tres triangulitos, 
se obtiene que 


$(11)+5(T)+5(13) =6 (1), 


pues los ángulos alrededor del nuevo vértice suman 27r, y el resto de 
los ángulos se asocia por parejas para dar los del original. 

Así que si subdividimos un triángulo T en triangulitos que sólo se intersecten 
en sus fronteras (una iteración de las dos subdivisiones que acabamos de analizar) 
obtenemos que d (T) es la suma de los déficit angulares de sus triangulitos: 


¡La función ¿(T) se comporta como una función de área! 


Pues medir el área de algo equivale a partir en pedazos chicos que no se traslapen y 
sumar sus áreas. Es concebible además, definir áreas no sólo de triángulos sino de 
cualquier figura hiperbólica con un proceso de triángulación, medir en triangulitos, y 
sumar; y en todo caso, un proceso de límites para figuras cuya frontera no esté seg- 
mentada. Ya no tenemos tiempo, espacio o aliento para llevar a cabo este programa, 
pero debe ser cierto. Y además que cualquier noción coherente de área debe ser un 
múltiplo de ésta que se nos atravesó. 
Se tiene que entre más chico sea un triángulo, más se parece a uno 
euclidiano; sus ángulos casi suman 7t y su déficit angular o área es casi cero. 
En el otro extremo, el área de cualquier triángulo está acotada por el área 
de los triángulos ideales (con sus tres vértices al infinito) que, como tienen 
ángulos de O grados, tienen deficit angular 7. Estos se pueden ver como el 
límite de triángulos cuya área 6 (T) es creciente pero tiende a T. 


8.5 Modelos de Poincaré y el hemiplano superior 


Además de los dos modelos del plano hiperbólico con que hemos trabajado hay otros 
dos importantes que describiremos en esta sección. 
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Consideremos al plano hiperbólico H? como la cazuela con- 
tenida en R* pero completando a éste último a [P*, es decir, añadi- 
endo un plano proyectivo al infinito. Formalmente, tomamos una 
nueva coordenada homogénea, w digamos, e identificamos (x, y, Z) 
con [x:y:z:1]. Nos interesa ver a HI? alrededor del infinito. 
Para esto podemos traer al plano al infinito al plano horizontal 
xy intercambiando las dos últimas coordenadas, [x:y:Z:w] 
lx: y :w:zl (> (x/z,y/z,w/z) en R3) que intercambia el plano 
z = 0 con el plano al infinito w = 0 (o equivalentemente, ver 
las cosas en la carta coordenada z 4 0). El efecto en la cazuela 
hiperbólica de esta transformación (vista en ¡R*) es mandarla en 
el hemisferio superior de la esfera unitaria S?; los unitarios temporales de abajo (con 
z negativa) van en el hemisferio inferior, y el ecuador es la imagen del cono de luz 
intersectado con el plano al infinito, donde se pegan ambas ho- 
jas. Pues los unitarios temporales están dados por la ecuación 


x2 + y? — 2? = —1, cuyo polinomio homogéneo asociado es 


x2 + y? 4 w — z?, que al tomar z = 1 (y mandar el plano 
z = 0 al infinito) nos da la ecuación x? + y? + w? = 1 en 
la carta coordenada afín z 4 0 parametrizada por xyw. Más 
aún. El cono de luz (con polinomio homogéneo x?+1y?—z?) se 
convierte en el cilindro circular x? + y? = 1; efectivamente, to- 
das sus rectas pasan ahora por el infinito vertical [0 : 0: 1: 0]; 
y los planos que pasaban por el origen son ahora planos ver- 
ticales. 


Tenemos entonces el modelo esférico de H? que consiste 
en el hemisferio superior de S? (todos sus puntos de tercera coordenada estrictamente 
positiva) con el círculo al infinito en el ecuador, y las líneas hiperbólicas son intersec- 
ciones con planos verticales, es decir semicírculos verticales, o bien, que intersectan 
ortogonalmente al ecuador. Notemos que el plano z = 1 (o, proyectivamente z = w) 
se ha quedado en su lugar. Así que la identificación del modelo proyectivo con el 
modelo esférico es simplemente proyectar al interior del círculo en el plano z = 1 
ortogonalmente sobre el hemisferio superior de la esfera S?. 
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El modelo de Poincaré se obtiene del modelo esférico proyectando estereográfi- 

camente desde el polo sur (0,0,—1) sobre el plano xy del ecuador. Se tiene entonces 
que como conjunto de puntos es de nuevo el interior del círculo unitario, 
pero ahora las rectas hiperbólicas son círculos ortogonales a la frontera. 
Los puntos se mueven hacia el centro de tal manera que lo que antes 
eran segmentos de recta se vuelven ahora segmentos de círculos que 
llegan perpendicularmente a la frontera. Lo importante de este mod- 
elo es que es conforme, es decir, los ángulos hiperbólicos coinciden con 
los ángulos euclidianos en que se encuentran las líneas (que ahora son 
círculos, insistimos). Este modelo es el que usa Escher en sus grabados 
famosos. 

Otra cosa que hay que notar del modelo de Poincaré es que en 
él los horociclos (recuérdese, las curvas que son ortogonales a un haz 
paralelo) son de nuevo círculos. Precisamente los circulitos tangentes 
a S' en el punto al infinito correspondiente al haz. 

El modelo del hemiplano superior se obtiene también del mod- 
elo esférico por una proyección estereográfica, pero ahora desde un 
punto en el ecuador (en el infinito) sobre una pantalla vertical que se 
identifica con el plano de los números complejos, C. Como el círculo al infinito va a 
dar a una recta, a ésta se le identifica con la recta real en C de tal manera que la 
imagen de H? resulta ser los números complejos cuya parte imaginaria es positiva; y 
de ahí su nombre. De nuevo, este modelo es conforme. Las rectas hiperbólicas aquí 
son semicírculos ortogonales a la recta real y líneas verticales. Los horocíclos son cír- 
culos tangentes a la recta real y líneas horizontales, que corresponden al único punto 
al infinito que no vemos (el infinito real); en estos horocíclos, la métrica inducida es 
euclidiana, así que la distancia se vuelve manejable, es inversamente proporcional a la 
altura. Además, lo bonito de este modelo es que la identificación del grupo hiperbólico 
H* (2) con las transformaciones de Moebius se hace nítida. A cada transformación 
de Moebius se le puede asociar de manera única, 


una matriz real 
a b 
c d 


con determinante 1. Y la fórmula 


ax +b 
cx+d 


u(x) = 


se extiende tal cual a una acción sobre el hemiplano superior que es justo la corres- 
pondiente transformación hiperbólica. Queda entonces el plano hiperbólico dentro de 
la esfera de Riemann (ver página 252). 
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8.6 *Subgrupos discretos 


La riqueza exhuberante de las simetrías en el plano hiperbólico sigue explorándose 
hoy día, así que no podemos ser exhaustivos; pero sí podemos señalar dos hechos 
importantes que indican lo profusos que son los subgrupos discretos de H (2). 
Notemos primero que la Proposición 8.9 nos dice con cuáles polígonos regulares 
como losetas se puede armar un mosaico que cubra el plano hiperbólico. Para que m 
polígonos regulares de n lados se ajusten alrededor de un vértice se necesita que su 
ángulo interno sea 2711 /m, y por la Proposición 8.9 tal polígono existe si y sólo si 


T(n —2) 


Así que para cada pareja n, m que cumpla la desigualdad anterior, se pueden pegar 
y pegar n-ágonos regulares con ángulo interno 2717/m por sus aristas de tal manera 
que ajusten m alrededor de cada vértice. Al mosaico resultante, que cubre HX?, lo 
podemos llamar ((n, m)) usando la notación de Schlafli que introdujimos al final del 
capítulo ??. Nótese que los ocho valores de n y m que no cumplen la desigualdad 
anterior (y con n, m > 3 para que tenga sentido) dan lugar a los mosaicos euclidianos 
(el (3, 6), el (4,4) y el (16,31) y a los esféricos o platónicos (el (3,3), el (3, 4), el 
(4, 3), el 3,5) y el 45, 3). 

El grupo de simetrías del mosaico hiperbólico (n, m), esto es, las isometrías hiper- 
bólicas que preservan la colección de polígonos (n, mp, está generado por tres reflex- 
iones. Al escoger uno de los n-ágonos tenemos las dos reflexiones py, p, que generan el 
diédrico D,, de sus simetrías, y además está la reflexión p, en su arista que lo manda 
a su polígono adyacente (p, y p, generan entonces al diédrico D, de simetrías que 
fijan el vértice base). Se tiene entonces que Py, P¡, P2 son las reflexiones en los lados 
de un triángulo con ángulos internos 1/n, 1/m, 1/2. Llamemos Tm 2 a este grupo. 

Claramente se puede generalizar a los llamados grupos triangulares Un mx (o calei- 
doscópicos) generados por las reflexiones po, py, p, en los lados de un triángulo con 
ángulos internos 1/n, 1/m, r/k. Entonces los generadores cumplen las relaciones 


(el ==) 1 


donde 1 es la identidad, y estas relaciones definen en abstracto al grupo. Cuando 


Lia 
n m k 


Dibujo... 
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este grupo se representa geométricamente en el plano hiperbólico, es decir Th mx E 
H (2); cuando la misma suma da 1 es de isometrías euclidianas y lo habíamos visto 
en la Sección 3.9.2, y cuando la suma excede a 1 es esférico (ver Sección 5.4.3). 

Nótese, además, que los grupos Tm, x hiperbólicos cumplen las dos propiedades 
de los que habíamos llamado grupos cristalográficos en 3.9.2 al cambiar R? por H?; 
es decir, son discretos y “cocompactos” . 


Capítulo 9 


Cónicas IV (tangentes y polaridad) 


En este último capítulo recopilamos brevemente las implicaciones que nuestro desa- 
rrollo de la geometría hiperbólica tiene para las cónicas en general. Para construir la 
geometría hiperbólica usamos la forma bilineal de Lorentz asociada al círculo unitario, 
pero se puede hacer lo análogo para cualquier cónica. 


9.1 Forma bilineal de una cónica 


Consideremos una cónica C en R? definida por un polinomio cuadrático P (x, y). 
Hemos visto (capítulo 7) que C tiene una completación proyectiva (obtenida al homo- 
geneizar el polinomio) que seguiremos llamando CC P? (al fin que se le añaden a lo 
más dos puntos). Y que una cónica proyectiva tiene una matriz simétrica A (de 3 x 3) 
asociada, de tal manera que su polinomio homogéneo, que también hemos llamado 
su forma cuadrática asociada, se escribe 


P(x) =x Ax =x:- (Ax). 


Tiene entonces una forma bilineal simétrica asociada, al diferenciar las dos apari- 
ciones de la variable x: 


xeay:=x Ay =x-(Ay) =(Ax) -y. (9.1) 


Ésta es una función de dos variables en ¡R* que toma valores reales. Y cumple clara- 
mente que 


X0AY=Y 01 X (es simétrica); 
(ax+fBy)erz=a (xe1 2)+f8$ (y ea 2); 
xer[ay+fz)=a[(xexy)+Bf (xex 2) (es bilineal). 


Las dos últimas ecuaciones son redundantes; basta con una de ellas pues entonces 
de la simetría se obtiene la otra; las ponemos simplemente para enfatizar su carácter 
bilineal (lineal en cada variable). 
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9.2 Tangentes y polaridad 


Supongamos que det A % 0, es decir, que la cónica original C( es no degenerada. 
Podemos definir entonces para cualquier fu] e P?, su recta A-polar, que denotamos 
lu]? por la ecuación lineal homogénea 


lu]? : uerx=(Au).x=0. 


Para demostrar que este polinomio lineal homogéneo no es cero y que ul? es efecti- 
vamente una línea, es necesario suponer que det A % 0; pues entonces, como u 4 0 
se tiene que Au A 0. 

Decimos que dos puntos [u], [v] € P? son A-polares o A-ortogonales si Uex V =0. 
Es claro que es una relación simétrica. En particular 


ue? SS. mel”. (9.2) 
Si todos nuestros datos estan en I¡R?, es decir, si lu] = [a: b: 1], entonces la 
ecuación de [u]? tiene la forma 
Xx a Xx 
(a,b,IA| y =|A[ b y |=0, 
1 1 1 


que es una línea en R? siempre y cuando [Au] 4 [0:0: 1]. Si u es tal que [Au] = 
[0 : O: 1] entonces su línea A-polar es la línea al infinito y [u] es el centro de la cónica; 
de aquí que el centro, que habíamos detectado algebraicamente, es sólo un invariante 
afín, y que las parábolas “no tienen” centro: también está en el infinito. 

Regresando a P?, para que no aparezcan casos especiales, tenemos que toda línea 
l es la A-polar de un punto. Pues si l está dada por la ecuación v-x = 0, como A 
es invertible, tomamos u = A7lv y entonces l es A-polar de [u]. Así que también 
podemos hablar del punto A-polar de una línea y la A-polaridad establece una 
biyección entre puntos y líneas de P?. 

Hemos estudiado dos casos. Primero, cuando A es la identidad: la I-polaridad 
corresponde a la ortogonalidad euclidiana o la dualidad en el proyectivo, y seguiremos 
usando este término para distinguirla. Y segundo, cuando A es la matriz de Lorentz 
y corresponde a la “polaridad” respecto al círculo unitario que apareció desde el 
capítulo 2. En la primera se tiene que un punto nunca está en su línea polar (de 
hecho es la línea más lejana a él de acuerdo con la métrica proyectiva), pero de la 
segunda podemos generalizar el principio fundamental. 


Lema 9.1 SC es no degenerada y no vacía, entonces la línea polar de un punto en 
C es su línea tangente. 


Demostración. Estamos suponiendo que det A 4 0 y además que tenemos [u] € C, 
es decir, tal que u e1 u = 0; pues C está determinada por la ecuación x e, x = 0. 
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Sea £ = [u]?*; queremos demostrar que LMC = [u]. Supongamos que no; que existe 
[v] 4% lu] tal que [v] € LMC. Vamos a probar que entonces l € C. Los puntos de 
l se escriben como [au + f v], y para cualquier a, f € R se tiene, por la simetría y 
bilinearidad, que 


(au+pv) e, (au + Bv) = 0? (ue, u) +20 (ue, v) + B? (ve, v). 


El primer sumando es 0 pues [u] € C, el segundo también lo es pues [v] € l S uexv = 
0, y el tercero es cero al suponer que [v] € C. Por tanto l € C, y como contiene una 
recta entonces C es degenerada. La contradicción implica el lema. O 


Con base en este lema y en la simetría polar (9.2) es fácil extraer las conclusiones 
análogas al caso del círculo. Suponiendo que A define una cónica no vacía (en R? 
puede ser elipse, parábola o hipérbola, y en P? simplemente no vacía y no degenerada), 
se cumple entonces que: 


1. Los puntos polares de líneas concurrentes son colineales, e inversamente, las 
líneas polares de puntos colineales son concurrentes. 


. El punto polar de una secante a C se obtiene intersectando las tangentes a 
los dos puntos donde corta a C; y podemos decir que este punto está afuera 
de C. E inversamente, si [u] está afuera de la cónica entonces su recta A- 
polar [u]? la intersecta en dos puntos (llamados los pies de [u] en la cónica 
C) cuyas tangentes pasan por [ul; así que para encontrar analíticamente 
los pies de un punto se encuentra la ecuación de su A-polar y se resuelve 
la ecuación cuadrática que da sus intersecciones con la cónica. 


. Si lu] está dentro de (es decir, ni afuera ni en) la cónica, entonces su recta 
A F 

A-polar [ul]” no la intersecta, está afuera y es la recta por los puntos polares 

a dos líneas cualquiera que pasan por [ul]. En particular, las intersecciones 

de las tangentes a los puntos extremos de cuerdas concurrentes son colineales 

(independientemente de dónde esté el punto de concurrencia). 


EJERCICIO 9.1 Encuentra los pies de .... a la cónica .... 


EJERCICIO 9.2 Demuestra que el centro de una cónica, cuando lo tiene, es un inva- 
riante afín. 


9.3 Armonía y el grupo de invariancia 


Toda cónica C (entenderemos por esto que es no vacía y no degenerada) tiene un grupo 
de transformaciones proyectivas que la deja invariante. Este es conjugado del grupo 
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hiperbólico bajo una transformación proyectiva g € Pr (2) que manda a C en el círculo 
unitario (g existe por el Teorema de clasificación de cónicas proyectivas del capítulo 
7). Así que se puede considerar al interior de la cónica C como el plano hiperbólico con 
su grupo de invariancia proyectiva como grupo de isometrías. Nótese que, puesto que 
g preserva tangencia, también preserva polaridad, y entonces podemos reinterpretar 
la polaridad en términos clásicos de armonía. 

Puesto que la línea polar del centro, O digamos, del círculo unitario es la recta al 
infinito, se cumple que toda recta l por O intersecta a su recta polar 0 en un par 
armónico respecto a sus intersecciones con el círculo (en una línea afín, el punto medio 
de un segmento es conjugado armónico del punto al infinito respecto a los extremos); 
es decir, 0 € l y LN o? es un par armónico respecto a la pareja LN S'. Como se 
puede mandar proyectivamente a la terna S', 0,2 en cualquier terna que consiste en 
una cónica C, un punto c en su interior y una recta por él; y las transformaciones 
proyectivas preservan armonía (Teorema 6.6), se tiene la siguiente: 


Proposicion 9.2 Sea c un punto interior de una cónica (no vacía 
y no degenerada) C. Entonces la recta polar de c respecto a.C. está 
formada por los conjugados armónicos de c respecto a la pareja 
£ONC, donde l corre por las rectas que pasan por c; es decir, si 
c El entonces c, LN c+ es armónico del paren C. 


Una manera, quizá más bonita, de entender esto es observar que el análogo de 
una cónica (no vacía y no degenerada) en la línea proyectiva, es decir, en dimensión 
1, es una pareja de puntos. Respecto a ellos hay polaridad en P! que es precisamente 
la relación de armonía; a cada punto se le asocia su conjugado armónico. Lo previo 
equivale a decir que al restringir la polaridad respecto a una cónica en PP? a sus 
líneas proyectivas se obtiene la polaridad ahí respecto a la intersección. Polaridad y 
armonía son instancias de lo mismo pero en diferentes dimensiones. Y debe ser claro 
que al subir la dimensión, esto se exiende. Para superficies cuadráticas en P*, los 
puntos tienen planos polares formados por los puntos en las líneas por él que son sus 
armónicos con respecto a la intersección con la msuperficie; las líneas tienen líneas 
polares o armónicas y los planos tienen puntos polares. 


EJERCICIO 9.3 Define algebraicamente el plano polar de un punto respecto a una 
superficie cuadrática en R$. 


9.4 Cónicas y proyectividades de rectas 
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Otro resultado del capítulo anterior que se generaliza fácilmente es el de la corres- 

pondencia tangencial. Dada una cónica C (no vacía y no degenerada) se tiene que 

todas sus líneas tangentes se identifican natural y canónicamente. Si l y l2 son dos 
tangentes a C, su correspondenica tangencial es la transfor- 
mación entre ellas que completa continuamente a: 


L; o La, 
tnt e tanta, 


donde l corre por el resto de las tangentes de C. Que esta 

transformación es proyectiva se sigue de lo que ya hicimos 

(Proposición 8.8) al identificar proyectivamente a C con el 

círculo unitario. Pero surge una pregunta interesante que es 
la inversa, y cuya respuesta nos dará la oportunidad de colar de refilón resultados 
clásico que no habían tenido cabida en el texto. 

Supongamos que fl; y l, son dos rectas en P? y que f : Ll; — l, es una transfor- 
mación proyectiva entre ellas. ¿Será cierto que las líneas (p, f (p)) con p € f; son las 
tangentes a una cónica? Es decir ¿es toda transformación proyectiva entre rectas una 
correspondencia tangencial? Por supuesto que debemos eliminar el caso con el que 
empezamos a estudiar la geometría proyectiva que es la proyección desde un punto. 
Nótese que al proyectar desde un punto, la intersección po := fl; N l, se queda en 
su lugar, así que si añadimos la hipótesis de que f (po) 4 Po (que es el único punto 
donde podría pasar que (p, f (p)) no es una línea), la pregunta adquiere la dimensión 
de “teorema a la mano”. 

Antes de enunciarlo, recordemos la evidencia del “trazo artesanal de 
paraboloides” que algunos tuvimos la suerte de conocer desde la escuela 
secundaria. Si se toman dos intervalos no paralelos en una madera, se 
clavan clavitos a intervalos regulares en cada uno de ellos y luego se 
va entrelazando un hilo que una tachuelas correspondientes y de tal 
manera que se vaya cruzando (en un intervalo va en una dirección y en 
el otro al revés), se delinea una parábola, o, con un poco de imaginación 
tridimensional, parece un reglado de un paraboloide hiperbólico. Éste 
es un caso particular del problema anterior, la transformación entre las 
dos líneas es afín, y al corresponderse sus puntos al infinito, la línea por 
ellos es tangente a la cónica y por tanto es una parábola (dando ya por un hecho que 
la respuesta es afirmativa). 


Teorema 9.3 Sean l; y l, dos líneas en P? que se intersectan en po, y seaf:l = la 
una transformación proyectiva entre ellas. Si f (po) H po, entonces f es la correspon- 
dencia tangencial de una cónica; y si f (po) = po, f es la proyección desde un punto. 
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Supongamos primero que f (po) = po. Consideremos otros dos 
puntos a,b € l¡, y sea q = (a,f(a)) N (b,f(b)). La proyección 
desde q de l; a l) coincide con f en tres puntos y por lo tanto (Teo- 
rema de 3 en 3) es f. 

Supongamos entonces que f (po) 4 Po. Notemos primero que la 
cónica que estamos buscando (la que dará la correpondencia tangen- 
cial entre l; y l) tiene como tangentes a l¡ y a l?. Consideremos 
tres nuevas rectas l3,l4 y ls; de la forma (p,f (p)) con p € fl¡; si encontramos una 
cónica C que tenga a estas cinco rectas como tangentes habremos terminado: la 
correspondencia tangencial de fl; a fl, respecto a C coincide con f pues lo hace en 
tres puntos. Obsérvese entonces que estamos demostrando que el conjunto de rectas 
Lp, f (p)) | p € £1) son las tangentes a una cónica. 

Queda por demostrar que hay una cónica tangente a cinco rectas dadas. Lo 
haremos dualizando un teorema clásico. 


Teorema 9.4 Por cinco puntos (distintos) en P? pasa una curva cuadrática; ésta es 
única si y sólo si no hay cuatro de ellos colineales, y es no degenerada (una cónica) 
si y sólo si están en posición general. 


Demostración. Si no están en posición general, tres de los puntos son colineales y 
la recta l que pasa por ellos tiene que estar en la cónica (de no ser así, la intersectaría 
en tres puntos). Además, l junto con la recta que pasa por los otros dos es la cónica 
deseada (y degenerada); y está claro que no es única sólo cuando un cuarto, o todos, 
están en f, pues entonces la segunda recta se puede hacer variar. Preocupémonos 
entonces por la existencia en general. 


Podemos suponer que los cinco puntos están en R?. Consideremos las seis cons- 
tantes del polinomio general de segundo grado como incógnitas. Al evaluar con las 
coordenadas de uno de los puntos dados e igualar a 0 (queremos que el punto anule 
el polinomio) se obtiene una ecuación lineal homogénea en las incógnitas. Tenemos 
entonces cinco ecuaciones lineales homogéneas con seis variables. Tienen una solución 
no trivial: esos valores nos dan un polinomio que se anula en los cinco puntos dados 
y define la cónica que buscamos. 

Formalmente hay un problemita; en este libro nunca llegamos a sistemas lineales de 
5 por 6. Si se nos cree esta última afirmación, o ya se manejan rudimentos de álgebra 
lineal, que ahí quede el asunto; pero por puro prurito matemático una demostración 
que sólo usa elementos intrínsecos se describe en los ejercicios. 

La unicidad equivale a que las soluciones tengan dimensión uno, pues dan entonces 
múltiplos de un polinomio y definen la misma cónica. Es más latoso de ver que 
esto equivale al enunciado del teorema. Los ejercicios de la demostración alternativa 
realzan entonces su valía. O 
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Regresando al Teorema 9.3, las cinco rectas corresponden a cinco puntos en el 
plano proyectivo dual, ( pa, que conviene pensar por separado de IP? aunque acabe- 
mos usando tres coordenadas proyectivas en cada uno de ellos. (Aquí estamos usando 
la dualidad clásica, donde a una recta le corresponde el punto [v] tal que la ecuación 
v-.x=0 la define, y que hemos denotado li, +— lv].) Además, estos cinco puntos 
están en posición general, pues por la construcción es fácil ver que no hay tres de 
las rectas concurrentes (lo contrario implicaría que f(po) = po). Por el Teorema 9.4 
existe una cónica C” no degenerada, en da A que pasa por los cinco puntos. Tiene 
una matriz simétrica asociada A con det A % 0. Para concluir, vamos a demostrar 
que la cónica asociada a la matriz A”! es tangente a las cinco rectas originales. 

Supongamos que [v] € ( pa está en la cónica C”, es de- 


cir que v! Av= 0. Sabemos que la recta tangente a C' en 


[v] está dada por la ecuación (Av) .x = 0. Pero además cor- Ñ 
responde a un punto en IP?; precisamente a [Av] € P?, que y 
por la dualidad es un punto en la recta l¡y (piénsese en una EN 


de las cinco originales). Tenemos entonces que las rectas 


tangentes a C” nos definen puntos en las rectas originales 
(los duales de sus tangentes), y estos puntos cumplen 


(Av) AT (Av) =v' (ATACA) v=v'A v=v'Av=0. 


Entonces, si C es la cónica asociada a la matriz A7?, su tangente en el punto [Av] es 
lia-1(a0m1 = lm]- Y queda demostrado el Teorema 9.3. 

La generalidad de estos últimos párrafos es para poder concluir con algo que era 
de esperarse. 


Teorema 9.5 Las tangentes a una cónica (no vacía y no degenerada) forman una 
cónica en el plano proyectivo dual. 


EJERCICIO 9.4 Demuestra, resolviendo el sistema de ecuaciones 5 x 6 correspondiente, 
que una cónica C pasa por los puntos (0,0),(1,0),(0,1), (1,1), si y sólo si está definida por 
un polinomio de la familia 

ax(x-1)+cy(y-—1) 


con la: c] e P!. 


EJERCICIO 9.5 Demuestra que cualquier p € P? distinto de los cuatro puntos ante- 
riores está en exactamente una de las cónicas de la familia. Concluye el Teorema 9.4 usando 
el de 4 en 4. 


9.5 El Teorema místico de Pascal. 
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El dual del Teorema 9.3 da que si tenemos una transformación proyectiva entre dos 
haces de rectas (concurrentes), entonces los puntos de intersección de los pares de 
rectas correspondientes forman una cónica o una recta. Esto 
implica que las cónicas pueden definirse axiomáticamente sin 
uso de coordenadas o ecuaciones, son algo natural dentro de la 
geometría proyectiva, pues solo dependen de la relacion de in- 
cidencia. Veamos. Las proyecciones desde un punto entre rec- 
tas (con lo que empezamos a estudiar geometría proyectiva) se 
definen por incidencia (rectas que pasan por dos puntos e inter- 
secciones de rectas), a veces se les llama perspectividades. Sin 
embargo, la composición de perspectividades no necesariamente es una perspectivi- 
dad, es una transformación proyectiva o proyectividad. Estas nociones tienen sentido 
en el dual. Entonces, si tomamos los puntos £Nf (L) al correr l en un haz concurrente 
(una línea dual) y siendo f una proyectividad con otro haz, se obtiene, en general, 
una cónica. Esta sería su definición sintética. Hacemos enfásis en esto al final para 
recordar y dar evidencia de lo que decíamos al principio: que también se puede hacer 
geometría a partir de axiomas y se llega a lo mismo;! la "geometría" es una. 

Para concluir, demostramos un teorema clásico usando el inverso de lo anterior, 
que las cónicas definen proyectividades entre los haces de rectas por sus puntos. 


Teorema 9.6 (Pascal) Los lados opuestos de un hexágono inscrito en una cónica 
se intersectan en puntos colineales. 


Demostración. Consideremos seis puntos p1,P2,...,Ps en una cónica C. Nótese 
que el orden en que los dimos es independiente del orden cíclico en que aparecen en 
la cónica; el que usamos en la figura es simplemente para que los puntos relevantes 
queden cerca. Denotemos por fl; a la línea que va del punto p; al siguiente (según 
el hexágono), es decir, €; := (pi, pi+1), donde pz = py; nótese que las seis líneas son 
distintas pues estamos suponiendo (con nuestra acepción de la palabra cónica) que C 
es no degenerada. Y denotemos pi; := %N4;, para 1 4H j; de tal forma que Pp; = Pri-1)i- 
Debemos demostrar que los puntos P14,P25,P36 son colineales. 
Sea f : l4 — l; la transformación proyectiva que se obtiene identificando a l4 con 
el haz concurrente en py (l4 > p > (p,p1)), luego a éste con el haz de pz a través 
de la cónica C y finalmente a éste haz con l; (por intersección). 
Ñ Nótese que f se puede pensar como proyectar l4 a C desde pj 


<<) No seguida de proyectar C a l5 desde p3, y tenemos entonces los 


No E) siguientes datos de f: 
ds YO Pa HD PH P3 
4 Plis > Ph Pp 
4 Pas HF? Pó6 > Pe 
Ps + Ps F2 P5 


¡Este enfoque axiomático puede verse en [21]. 


9.5. EL TEOREMA MÍSTICO DE PASCAL. 393 


Puesto que f (ps) = ps = l4 M ls, se tiene que f es una proyección; y entonces es 
la proyección desde el punto 


(pa, p35) M (pas, po) = l3 Ml =P36. 


Como f (p14) = p25, se tiene entonces que Pj4,P25 Y P36 son colineales. O 


El Teorema de Pascal generaliza al de Papus (6.13), pues éste último puede pen- 
sarse como un caso especial para cónicas degeneradas. Aunque la demostración origi- 
nal de Pascal se desconoce, está enunciado en el Ensayo sobre las cónicas que publicó 
a los 17 años; es evidencía intelectual de que sí conocía el trabajo pionero sobre 
geometría proyectiva de Desargues; además, éste y su padre fueron amigos, así que 
por lo menos lo conoció bien. A veces se le añade el adjetivo “místico” al Teorema: 
quizá por lo del “hezagrama místico” o bien porque el mismo Pascal fué absorvido 
más adelante en su vida por el misticismo. 


EJERCICIO 9.6 Demuestra el Teorema de Papus (6.13) con la idea que se usó para 
demostrar el de Pascal. ¿Puedes enunciar y demostrar un Teorema de Papus-Pascal? Sólo 
falta analizar unos casos degenerados. 
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Capítulo 10 
Apéndice 


Este apéndice consta de dos secciones independientes. En la primera, establecemos 
muy brevemente las nociones básicas, la terminología y la notación de teoría de con- 
juntos que se usa en el libro. En la segunda, de un nivel mucho más alto, introducimos 
los números complejos apenas lo suficiente para enunciar el Teorema Fundamental del 
Álgebra. No damos su demostración, pero indicamos a grandes rasgos como probar 
el corolario de él que se usa en el capítulo 7. 


10.1 Conjuntos 


La propiedad básica de un conjunto A es que, dado cualquier objeto x, se puede decir 
six es elemento de A, escrito x € A y que se lee “x está en A”, o bien, si no lo es, lo 
cual se escribe x É A. 

Para definir un conjunto hay que hacer explícito de alguna manera cuáles son sus 
miembros o elementos. Esto se puede hacer, al menos, de tres maneras. Primero, 
mediante una lista explícita, por ejemplo, los números naturales son 


N3=10,1,2,9,*.<he 


Segundo, dando una propiedad o propiedades que cumplen sus elementos; y ter- 
cero, mediante un parámetro que recorre los elementos de otro conjunto previamente 
definido. Por ejemplo, los números naturales pares se pueden definir por esa propiedad 
(la de ser par) o bien mediante un parámetro que recorre a los naturales: 


(ne N|nes par) =(2n | n € N); 


“1” se lee “tal que” o bien “donde”; en algunos textos se usan 
q ; 


A Ss 


la barra de enmedio 
dos puntos “:” en vez de 
La unión y la intersesección de dos conjuntos A y B son respectivamente: 


AUB=(x|x€A o x€B) y ANB=(x|x€A y x€B). 
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Cuando todos los elementos de un conjunto A también son elementos de B, se dice 
que A es subconjunto de B, o bien que B contiene a A, y se escribe A C B, o bien 
B > A. De tal manera que siempre se tiene que AU B contiene a A y a B, y que 
AN B es subconjunto de A y de B. Otra operación de conjuntos (cómo obtener un 
conjunto a partir de otros dos) es la diferencia, que se denota AAB o bien A—B, que 
es 


AAB=A-—B:=1[x€AlIx¿ B). 


Un conjunto importantísimo es el conjunto vacío, que se denota (, y es el único 
conjunto que no tiene elementos; para cualquier x se tiene que x € (). Así que A— B 
cumple que BN(A—B) =/ y (A—B) C A. Además, el vacio es subconjunto de 
cualquier otro conjunto, pues por “vacuidad” se cumple para cualquier conjunto A 
que 

xENÑ > xeA, 


donde “=>” significa “implica que”; puesto que x € () nunca sucede, cada vez que 
sucede se cumple lo que sea. 

La última operación de conjuntos que usaremos es el producto cartesiano. Á partir 
de dos conjuntos A y B, se puede construir un nuevo conjunto A x B, llamado su 
producto que consta de todas las parejas ordenadas con el primer elemento en A y el 
segundo en B, es decir 


AxB:=((a,b)]|acA, be B). 


Relaciones 


Una relación R en un conjunto A es un subconjunto de su producto cartesiano, 
RCAXA; es decir, es distinguir una colección de parejas relacionadas. Pero es 
más comodo y usual denotarla con una tilde “ = ” (o un símbolo parecido) con la 
convención 


a=b > (ajb)er, 


donde “SG” significa “si y sólo si”; y cuando a = b se dice, y se lee, que a “está 
relacionada con” b. Vale entonces la notación a < b para (a,b) £ R: cuando a no 
está relacionado con b. 

Hay dos tipos de relaciones que con frecuencia surgen naturalmente. Una relación 
en A es una relación de orden si cumple las siguientes propiedades: 


i)a=a paratodo aeA  (reflexividad ); 
ii) a=b y b=-a => a=b; 


iii) a=b y b=c > a=c  (transitividad). 
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Un ejemplo claro de orden son los números naturales con la relación “ser menor 
o igual” denotada “ < ”. Otro es la relación de contención en el conjunto de los 
subconjuntos de un conjunto A; tienen entonces sentido las definiciones alternas “la 
unión de A y B es el mínimo conjunto que contiene a ambos” y “la intersección el 
máximo subconjunto común”. Obsérvese, además, que una relación de orden siempre 
tiene una relación de orden estricto asociada donde se eliminan de la relación a las 
igualdades a = a y se llama entonces antireflexiva. Para el orden en los números 
se obtiene “ser menor” denotada “ < ”; y para la de contención se obtiene la de 
“contención estricta”, G. 

Una relación = en A es de equivalencia si es reflexiva, transitiva y además cumple: 


iv)a=b > b=a (simetría). 


Cuando se tiene una relación de equivalencia en un conjunto A, los subconjuntos 
máximos tales que todos sus elementos están relacionados entre sí se llaman clases 
de equivalencia; y el conjunto A se parte en clases de equivalencia; es decir, cualquier 
elemento a € A está en una clase de equivalencia, la de los equivalentes a a, y las 
clases de equivalencia son disjuntas. E inversamente, una partición de un conjunto 
en subconjuntos ajenos y que lo cubren induce una relación de equivalencia en él. 

El otro concepto que, por elemental, debería entrar en este apéndice es el de 
“función”, pero es tan importante para el texto que decidimos incluirlo al principio 
del capítulo 3. 


10.2 Números complejos 


Los números complejos, denotados C, se construyen a partir de los números reales R 
al introducir, o anexar, un nuevo número que se denota 1, que cumple 


De tal manera que los números complejos se pueden definir como 


C:=[(a+bija,beR). 


Por la igualdad 1? = —1, la suma y la multiplicación de los reales se extiende natu- 
ralmente a C, de tal manera que se convierte en un campo (ver sección 1.3.1). 
Un polinomio en C es una expresión de la forma 


P(x)=09 ax + es e, (10.1) 


con sus coeficientes Cy,C1,...,Cn EC, y es de grado n si Cc, 4 0. De tal manera que 
para cualquier z € C se puede evaluar P (z) (desarrollando la expresión) y de nuevo 
es un número complejo. Una raíz de P es un número complejo que anula al polinomio, 
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es decir, tal que al evaluar a P en él da 0. Por ejemplo, las raices del polinomio x? +1 
son 1 y —1. 

El Teorema Fundamental del Álgebra, probado por Gauss, dice que un poli- 
nomio de grado n tiene n raíces, o más precisamente, que dado el polinomio (10.1) 
(con c, 4 0) existen 21,22,...,Zn € C (sus raíces) tales que 


P=Ab=a == =20 02 (= 24) 


Un campo con esta propiedad se llama algebraicamente cerrado. Los reales no lo 
son pues el polinomio x? +1 no tiene raíces reales; pero al adjuntar una raíz de él se 
cierra. 

El corolario de este teorema que se usa en el libro es que un polinomio real de 
grado impar tiene al menos una raíz real. Se sigue de la siguiente observación. 

Para cada número complejo z = a + bi se tiene su conjugado 


z=a-—bi, 
y es fácil ver que esta asignación cumple las siguientes propiedades: 


(Zz+w) = Zz+w 
(zw) = Zzw 
-=2 >> zZ ER. 


De tal manera que para un polinomio P (x) con todos sus coeficientes reales se 
tiene que P (z) = P (Z) para cualquier z € C. En particular, si zy es una raiz, tambien 
lo es su conjugado Zo, pues P (zo) = 0 =P (zo) = P (Zo) . Es decir, las raíces complejas 
(no reales) de un polinomio con coeficientes reales vienen en parejas conjugadas. Y 
por lo tanto, si tiene grado impar tiene al menos una raíz real. 
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de bisectrices, 65 
de Desargues, 293 unión, 395 


INDEX 411 


valor 
absoluto, 46 
propio, 189, 322, 323 
vector, 9 
(es) direccionales de un plano, 20 
cero en Rn, see origen 
direccional de una recta, 13 
en el plano, 5 
en Rn, 7 
espacial, 342 
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